『ビューティフルデータ』を読んだ。
本書は次の20章からなる。「データ」という一応のテーマはあるけれど、テーマ自体が広いから、各章の内容はバラエティに富んでいる。
1章 データの中に生活を見る
2章 ビューティフル・ピープル─ユーザの存在を忘れることなくデータ収集の手段をデザインする
3章 火星上での組み込み画像処理
4章 PNUTShellにおけるクラウドストレージの設計
5章 情報プラットフォームと データサイエンティストの登場
6章 写真アーカイブの地理学的な美
7章 データの自己発見
8章 リアルタイムのポータブルデータ
9章 ディープウェブを活用する
10章 Radiohead「House of Cards」の プロモーションビデオができるまで
11章 都市データの視覚化
12章 sense.usの設計
13章 データでできないこと
14章 自然言語のコーパスデータ
15章 データの中の生命:DNA物語
16章 実世界のデータをビューティフルにする
17章 外見のデータ解析:数百万人の社会的ステロタイプ調査
18章 ベイエリア・ブルース:住宅市場崩壊の影響
19章 政治に関するビューティフルデータ
20章 データをつなぐ
自分が面白いと思ったのは、2章、3章、7章、10章、20章の5章。
2章は、データそのものではなくデータを集めるプロセスについての話。
ここがしっかりしていないと、汚れたデータしか集まらなくて、分析しようと思った時に泣かされる。
3章は、火星探査機とのデータの授受に関する話。
制約が普通では考えられないくらい厳しいときに、どう考えていたのかが垣間見えて新鮮。
7章は、データが追加された時に、既存のデータが反応するような系を考えている。
研究のベースとなるアイディアを説明している印象。
10章は、データを使った死角化の話。
センシングの話が面白い。実世界からデータが自動的に取れるって楽しそう。
20章は、異なるスキーマを持つデータベースをどうつなげるか、という話。
異なるスキーマで記録されているけれど、同一の実態を指すレコードをどう同定するか? について考えている。
基本的なアイディアは、色んな情報が一致していたら、多少違っても同じだとみなそう、というもの。
言うのは簡単だけれど、実装するのは難しい。
認識論の指示理論のクラスター説・群概念説と絡めて考えると楽しそう。
実装の助けにはなりそうにないけれど。
本書は次の20章からなる。「データ」という一応のテーマはあるけれど、テーマ自体が広いから、各章の内容はバラエティに富んでいる。
1章 データの中に生活を見る
2章 ビューティフル・ピープル─ユーザの存在を忘れることなくデータ収集の手段をデザインする
3章 火星上での組み込み画像処理
4章 PNUTShellにおけるクラウドストレージの設計
5章 情報プラットフォームと データサイエンティストの登場
6章 写真アーカイブの地理学的な美
7章 データの自己発見
8章 リアルタイムのポータブルデータ
9章 ディープウェブを活用する
10章 Radiohead「House of Cards」の プロモーションビデオができるまで
11章 都市データの視覚化
12章 sense.usの設計
13章 データでできないこと
14章 自然言語のコーパスデータ
15章 データの中の生命:DNA物語
16章 実世界のデータをビューティフルにする
17章 外見のデータ解析:数百万人の社会的ステロタイプ調査
18章 ベイエリア・ブルース:住宅市場崩壊の影響
19章 政治に関するビューティフルデータ
20章 データをつなぐ
自分が面白いと思ったのは、2章、3章、7章、10章、20章の5章。
2章は、データそのものではなくデータを集めるプロセスについての話。
ここがしっかりしていないと、汚れたデータしか集まらなくて、分析しようと思った時に泣かされる。
3章は、火星探査機とのデータの授受に関する話。
制約が普通では考えられないくらい厳しいときに、どう考えていたのかが垣間見えて新鮮。
7章は、データが追加された時に、既存のデータが反応するような系を考えている。
研究のベースとなるアイディアを説明している印象。
10章は、データを使った死角化の話。
センシングの話が面白い。実世界からデータが自動的に取れるって楽しそう。
20章は、異なるスキーマを持つデータベースをどうつなげるか、という話。
異なるスキーマで記録されているけれど、同一の実態を指すレコードをどう同定するか? について考えている。
基本的なアイディアは、色んな情報が一致していたら、多少違っても同じだとみなそう、というもの。
言うのは簡単だけれど、実装するのは難しい。
認識論の指示理論のクラスター説・群概念説と絡めて考えると楽しそう。
実装の助けにはなりそうにないけれど。