2012-04-26から1日間の記事一覧

与えられたデータをtrainデータとtestデータに分割する

rec_log_train.txtの行数を数えてみた。 約7300万行ある。 これを20分の1ずつ(よく見たら21分の1ずつになってた)trainデータとtestデータに分割する。 #! /usr/bin/env python # -*- coding: utf-8 -*- import random file = open("rec_log_trai…

grepで正規表現を使う

http://di-ver-si-ty.seesaa.net/article/25635255.htmlタブは\tじゃなくて [[:space:]]を使う。タブで挟まれた1は、 grep "[[:space:]]1[[:space:]]" inputfile

KDD2012 Track1 スコアの計算プログラム

スコアを計算するプログラムを書いた。 #! /usr/bin/env python # -*- coding: utf-8 -*- #ファイル読み込み # **注意**入力データは勧める対象のユーザによってソートしておくこと! #アルゴリズムで求めた方のデータ f_a = open("algorithm.txt") a_data =…

MAMP上にSSL環境を構築する

Facebookアプリのテストでローカルでhttpsプロトコルを使うので。このページを参考に設定しました。 http://www.yokada.net/blog/1411 恐らくこの手順で行けば問題無いと思います。はまりそうな点としては、 (1)server.csrファイル作成時の「Common Name」は…

Facebookアプリをつくる

Facebookアプリを開発してみよう http://socialmediaexperience.jp/2638 Facebookアプリの作り方 PHP編 http://golog.plus.vc/web/2782/Herokuで作るFacebookアプリ http://gihyo.jp/dev/serial/01/herokuそういえばハッカソンの初回でFacebookアプリをHeork…

Jekyllをはじめる

Githubのホスティングの利用に際して 静的HTMLジェネレータであるJekyllを始めようと思います。 http://tokkonopapa.github.com/blog/2011/12/28/easy-usage-of-jekyll-on-github/ http://mattn.kaoriya.net/software/lang/ruby/20090409185248.htm http://c…

Twitterをはてなダイアリーに貼り付ける

http://d.hatena.ne.jp/shwvfuv/20120408/1333810858 http://www.shikidahironori.jp/music/2009/10/twitter.htmlリプライを消したいんだけど、公式ウィジェットだと設定項目がなさそう。 JSONをパースしてるだけらしいので、書き換えればいいんだけど はて…