スキップしてメイン コンテンツに移動

Data is Beautiful

『ビューティフルデータ』を読んだ。

本書は次の20章からなる。「データ」という一応のテーマはあるけれど、テーマ自体が広いから、各章の内容はバラエティに富んでいる。

1章 データの中に生活を見る
2章 ビューティフル・ピープル─ユーザの存在を忘れることなくデータ収集の手段をデザインする
3章 火星上での組み込み画像処理
4章 PNUTShellにおけるクラウドストレージの設計
5章 情報プラットフォームと データサイエンティストの登場
6章 写真アーカイブの地理学的な美
7章 データの自己発見
8章 リアルタイムのポータブルデータ
9章 ディープウェブを活用する
10章 Radiohead「House of Cards」の プロモーションビデオができるまで
11章 都市データの視覚化
12章 sense.usの設計
13章 データでできないこと
14章 自然言語のコーパスデータ
15章 データの中の生命:DNA物語
16章 実世界のデータをビューティフルにする
17章 外見のデータ解析:数百万人の社会的ステロタイプ調査
18章 ベイエリア・ブルース:住宅市場崩壊の影響
19章 政治に関するビューティフルデータ
20章 データをつなぐ

自分が面白いと思ったのは、2章、3章、7章、10章、20章の5章。

2章は、データそのものではなくデータを集めるプロセスについての話。
ここがしっかりしていないと、汚れたデータしか集まらなくて、分析しようと思った時に泣かされる。

3章は、火星探査機とのデータの授受に関する話。
制約が普通では考えられないくらい厳しいときに、どう考えていたのかが垣間見えて新鮮。

7章は、データが追加された時に、既存のデータが反応するような系を考えている。
研究のベースとなるアイディアを説明している印象。

10章は、データを使った死角化の話。
センシングの話が面白い。実世界からデータが自動的に取れるって楽しそう。

20章は、異なるスキーマを持つデータベースをどうつなげるか、という話。
異なるスキーマで記録されているけれど、同一の実態を指すレコードをどう同定するか? について考えている。
基本的なアイディアは、色んな情報が一致していたら、多少違っても同じだとみなそう、というもの。
言うのは簡単だけれど、実装するのは難しい。

認識論の指示理論のクラスター説・群概念説と絡めて考えると楽しそう。
実装の助けにはなりそうにないけれど。

このブログの人気の投稿

北へ - ゴールデンカムイ 16

『ゴールデンカムイ 15』、『〃 16』を読んだ。16巻を読み始めてから、15巻を買ったものの読んでいなかったことに気がつく。Kindle版の予約注文ではままあること。 15巻は「スチェンカ・ナ・スチェンク」、「バーニャ(ロシア式蒸し風呂)」と男臭いことこのうえなし。軽くWebで調べてみたところ、スチェンカ・ナ・スチェンク (Стенка на стенку) はロシアの祭事マースレニツァで行われる行事のようだ[1]。それなりになじみ深いものらしく、この行事をタイトルに据えたフォークメタルStenka Na StenkuのMVが見つかった。 16巻では杉元一行は巡業中のサーカスに参加することになる。杉元と鯉登の維持の張り合いが、見ていて微笑ましい。鯉登は目的を見失っているようだが、杉元もスチェンカで我を失っていたので、どっこいどっこいか。なお、サーカス/大道芸を通じた日露のつながりは、実際にもこのような形だったようだ[2]。 個々のエピソードから視線を上げて、全体の構図を眺めてみると、各勢力がすっかり入り乱れている。アシㇼパは尾形、キロランケ、白石とともにアチャの足跡を辿り、そのあとを鶴見のもとで家永の治療を受けた杉元が鯉登、月島を追っている。今更だけれど、杉元やアシㇼパは、第七師団と完全に利害が衝突していると考えていないはずだった。一方で、土方一味も入墨人皮を継続。むしろ彼らの方が第七師団との対立が深刻だろう。さらに北上するキロランケはまた別の目的で動いているようだけれど、なんで尾形も一緒なんだっけ? 『進撃の巨人』に引き続き、これもそろそろ読み返す時期か。 [1] 5つの暴力的な伝統:スラヴ戦士のようにマースレニツァを祝おう - ロシア・ビヨンド [2] ボリショイサーカスの源流は、ロシアに渡った幕末日本の大道芸人たちにあった 脈々と息づく「クールジャパン」 | ハフポスト

戦う泡沫 - 終末なにしてますか? もう一度だけ、会えますか? #06, #07

『終末なにしてますか? もう一度だけ、会えますか?』の#06, #07を読んだ。 『終末なにしてますか? もう一度だけ、会えますか?』の#06と#07を読んだ。#06でフェオドールの物語がひとまずは決着して、#07から第二部開始といったところ。 これまでの彼の戦いが通過点のように見えてしまったのがちょっと悲しい。もしも#07がシリーズ3作目の#01になっていたら、もう少し違って見えたかもしれない。物語の外にある枠組みが与える影響は、決して小さくない。 一方で純粋に物語に抱く感情なんてあるんだろうか? とも思う。浮かび上がる感情には周辺情報が引き起こす雑念が内包されていて、やがて損なわれてしまうことになっているのかもしれない。黄金妖精 (レプラカーン) の人格が前世のそれに侵食されていくように。

リアル・シリアル・ソシアル - アイム・ノット・シリアルキラー

『アイム・ノット・シリアルキラー』(原題 "I Am Not a Serial Killer")を見た。 いい意味で期待を裏切ってくれて、悪くなかった。最初はちょっと反応に困るったけれど、それも含めて嫌いじゃない。傑作・良作の類いではないだろうけれど、主人公ジョンに味がある。 この期待の裏切り方に腹を立てる人もいるだろう。でも、万人受けするつもりがない作品が出てくるのって、豊かでいいよね(受け付けないときは本当に受け付けないけれど)。何が出てくるかわからない楽しみがある。