『カルチャロミクス』を読んだ。
乱暴に言うとGoogle Ngram Viewerの話だった。単語の出現頻度を数えるだけで、いろいろなことが示唆されるのがエキサイティング。
たとえば、検閲の効果。この分析の対象=公的に残された書籍からは、如実に消えているのが分かって、空恐ろしさを覚える。それでも、やがて息を吹き返すのだけれど。
データ分析の話だけでなく、データの前処理の話やさらにその前にデータを使うための政治や法律の話もあった。しかも、それらはシームレスに繋がっていて、物語として読みやすくなっている。巧いと思う。
残念なことに、Google Ngram Viewerは日本語に未対応。何か思いついても、試すことができない。日本語、英語より形態素解析(文章を単語に分解する処理)が面倒そうだもんなあ。それより権利関係の方が面倒か。
乱暴に言うとGoogle Ngram Viewerの話だった。単語の出現頻度を数えるだけで、いろいろなことが示唆されるのがエキサイティング。
たとえば、検閲の効果。この分析の対象=公的に残された書籍からは、如実に消えているのが分かって、空恐ろしさを覚える。それでも、やがて息を吹き返すのだけれど。
データ分析の話だけでなく、データの前処理の話やさらにその前にデータを使うための政治や法律の話もあった。しかも、それらはシームレスに繋がっていて、物語として読みやすくなっている。巧いと思う。
残念なことに、Google Ngram Viewerは日本語に未対応。何か思いついても、試すことができない。日本語、英語より形態素解析(文章を単語に分解する処理)が面倒そうだもんなあ。それより権利関係の方が面倒か。