名もなく死んでゆく僕らにできること。
デジタルアーカイブの作り方第三回目を勉強した。
巷でよくきくビッグデータというものに前々から興味があってこのオンライン授業を受けている。本日のテーマはビッグデータとオープンデータだ。
①ビッグデータは人を幸せにする。
②位置情報は諸刃の剣!
③名もなき民の、人類への無意識的貢献
以下、講義内容と自分の感想がごちゃ混ぜになった感想とレビューです。あしからず汗(^-^)。
ビッグデータとは、Wikipediaによれば、市販されているデータベース管理ツールや従来のデータ処理アプリケーションで処理することが困難なほど巨大で複雑な データ集合の集積物を表す用語(10月26日付)、とある。
ビッグデータとググると、右側にビッグデータを扱う企業の広告が目に入る。
言葉だとわかりづらいので、眼で語ると、2011年の東日本大震災の時に見た、あの東京近郊の人の交通を可視化したものが思い当たるだろう。サイケデリックでカラフルな人の流れが2時46分まで交通網をめまぐるしく回る。それは携帯電話の位置情報をもとに東大の空間情報科学センターが可視化したものだ。
またビッグデータとは、我々の知らないところで収集され使われる。
たとえば、アマゾン。これはいわずもがなであるが、過去に購入した履歴からおすすめ書籍をアマゾンは薦めてくる。自分の興味をひくような映画、ちょっとエッチなものを興味本位でみていただけでも、薦めてくる。そんなこといっちゃって、お兄さん、ほんとはほしいんでしょ?といわんばかりだw
またアマゾンは消費者の注文前に発注する特許を取得したニュースがある。日本語の意味がわからない。紐解いてみると、消費者の行動履歴を把握し、トイレットペーパーならトイレットペーパーだったりした、主に生活必需品を先読みし、消費者の近くの倉庫に備蓄しておく特許を取得したというものだ。住所、年齢、クレジットカード番号、行動履歴のすべてを一企業が握るわけだ。
ビッグデータは便利な反面、自分の行動が監視されている感はある。無意識のうちに企業にデータを提供する良し悪しも考えねばならない…と渡邊先生はおっしゃるが、
エドワード・スノーデンから言わせてみれば、そうした態度は極めてよくないらしい。プライベートな情報を守ることもまた市民にできるよりよい社会への“抵抗”になるからだという。グーグルとDropboxに近づくな、とスノーデンは言っているが、グーグルにどっぷり使っている俺の生活は、もうそれなしでは生きられないところまで来ているwここはシラケつつ、ノリ、ノリつつシラケさせてもらうしかないんじゃないのだろうか。グーグルがnot to evilであることを祈る、という極めて原始的な対抗策w?しかとれない自分がもどかしいが、まぁ、やっぱり、最後に人類の集合知は勝つという楽観的希望がある。司馬遼太郎先生申し訳ないですw
ほんっと、魔法使いのように思う。隠れマルコフモデルってなんだwww!!!この魔法の呪文!超すげぇ!俺は統計と科学が最強の魔法だと思ってるから、この二つを併せもったデータサイエンティストは、超最強なイメージを俺に与えてくれる。HTMLとPHPを少し齧っている程度の俺にとってはデータサイエンティストはまさに、超憧れの職業だ。
朝日新聞デジタルのビリオメディアというものがある。ビッグデータを可視化することで今まで見ることができなかった社会の傾向を知ることができる。地域ごとのヤフーのキーワード検索の検索数の盛り上がりを可視化するサイトで、たとえば防災グッズなどのことばの盛り上がりを知ることができる。これにより、四国、近畿地方が南海トラフ地震に備えていることがわかる。面白いのは、東日本大震災以降にこのキーワードがたくさん検索されているが、時間が経つにつれ、関心が薄れていくのが文字通り眼に見えてわかる。
またビリオメディアの他のサイトに2013年参議院選挙のデータがある。円の大きさで議論に出たキーワードの数を集計し可視化している。1位はTPP、2位は原発、そして以外にも3位の話題が児童ポルノであった。自分もどちらかといえばネットのヘビーユーザーなので、この順位はわからなくもないが、とはいえ、児童ポルノが一般的に話題になったと思えないなぁ、なんて思っていたら、このデータはTwitter上での議論から採取されたものなので、一般的オールドメディアの議論データは用いていないとのことだった。なるほど、とはいえ、児童ポルノ法、とりあえず、一段落、山田太郎議員、ありがとうございましたw!これからも愛読書はLOでありたいw泣笑
東日本大震災時、本田技研のデータが大活躍した話。ホンダ車に搭載されている位置情報を用いて、通れる道を可視化した。通行実績情報マップ。スゴいwww!
トヨタ自動車もウェザーニュースとコラボレーションし、関東甲信豪雪減災リポートマップを作成した。すごいwww!!!
いずれも、俺今まで知らなくて、ほんと、クソ虫なんじゃないかと、自己嫌悪い陥る。orz
2012年にTwitter社がIT業者に個人の過去のツイートデータを販売したことがニュースになったが、ま、いいんじゃねw、というのが俺の感想でした。やっぱ、個人情報リテラシーが俺は低いのかもしれないけど、大方、自分と同じ程度のセキュリティー意識なんじゃないかなぁ。
ここで考えたのが、すでに徐々にはじまっている社会、世間全体の総透明化社会だ。顔バレの抑止力といった方がいいだろう。これまで、ぎりぎりのグレーゾンだった、政界や財界、に限らず、組織、個人とありとあらゆる分野がクリーンになっていく。水に濁りがなければ大魚も居場所を失われるが、そんなのおかまい無しに、水質が綺麗になっていく。これはリアルタイムで見ていて本当にすごい。語彙がなくてめっちゃやばい、しかいえないが、これはいい意味の部分が多いが、めっちゃやばいのだ。これがどうヤバいのかと言うと、簡単に言えば、
その点において、フェースブックが全人類を強制的に“善人”にしようとする思想的背景はめっちゃ畏れ多くてスゴい。そんなの無理に決まってると思っていたら、舌の根も乾かぬうちに奴らの通りになっている。ウィキリークスにはじまり、マニング、スノーデン、ザッカーバーグ、この大きな潮流はアラブで顕在化し、潮(うしお)となって世界を洗濯しつつある。
また渡邊先生の息子さんを撮影した一万枚の写真を、グーグルアース上にマッピングしている話は微笑ましくて、息子さんがうらやましかったw。お父さんがデータサイエンティストってやっぱ、かっこいい。子どもがもの心ついたときに、肖像権の侵害だと、イリナ・イオネスコのように訴えられたらウケるなぁw
普段普通に使っているスマホから時間空間で個人の記録として使うことをライフログともいう。
次に、オープンデータ。ビッグデータとの違いはオープンデータはあまり商業向きではないこと。
オープンデータとは、オープン・ナレッジ・ファウンデーションの定義では、
をいう。政府や自治体、また公共機関が保有する使い勝手のよいデータのことである。
例えば渡邊先生の教える首都大学の時間割で考えてみると、①誰でもアクセスできる。クリア。②紙媒体で出力できる。データとしてエクセルやら、手入力でしなければならず使いづらいため。ノークリアー。③再配布できる。紙媒体で配ればできるので、これはクリアー。
オープンデータとは、上記の①、②、③の三つとも同時に満たすデータでなければならないため、この首都大学のデータはオープンデータではない、となる。
実はオープンデータとは再利用がくせものなのである。火曜日の授業だけぬきだしたい、時にPDFでは正直、利用しづらい。またこれだけでなく、東日本大震災時の関東近郊の計画停電も紙媒体の画像で停電のタイムスケジュールが配布されたため、グループわけデータが極めて使いづらかった。つまり、手入力をしなければならなかったわけだ。
3-4.
オープンデータ化を促進している自治体、公共機関。
市内公園のトイレの数もオープンデータ化している。使いやすいデータとは<>のタグで、位置情報だったり、男、女、ハンディキャップと
のことだ。プログラム処理しやすく、グーグルアースとも相性がいい。
また公園情報だけでなく、動物園の動物たちの日々の生活、たとえば餌の時間だとか、何を食べるだとかも、オープンデータ化されている。
また、
自治体のオープンデータ化の促進具合がわかるのだが、やはり圧倒的一位の鯖江がめっちゃくそかっこいい!!!!!
鯖江、いいわぁ。鯖江、いいわぁ。鯖江のいかカレー!!!どやっ!
東京都心の都市はフットワークも重い。行政としての腰の重さやまた、スケールが大規模なため大変というのもある。
オープンシティプロジェクト。経済産業書のデータを地図上でわかりやすく公開している。一見派手なグラフィックで見やすいかに見えるが、やり過ぎなw感もたしかにある。静止画のようなグラフィックで十分wと先生は語る。ま、インパクトが大事やからね。
とはいえ、あまり要らない機能の追加で税金使われるのもあれだけどw
また超重要なのは、重大なオープンデータサービスの永続性だ。
年度ごとに決算をしているためだと言うが、その時は民間の有志に寄って、データをつなげたが、政府や自治体は永続性に重きをおいてほしいね。でないと死活的なデータ利用者が大変困るわけだから。
また
非営利団体が運営しているサイトなのだが、これもめっちゃくそすごい!!!!!
これにより、ウェブサイトで自分が納めた税金の使い道がわかるのだ。すごい!!!!まじですげぇ!!!今まででも、これは別に税務署に行けばわかることなのだが、いちいち計算も難しいし、決まって役所のパンフにはモデルとなる年収500万円くらいの世帯の税金内訳くらいしかなく、個別な名もなき無数の典型者のモデルが抜けていた。というか、計算するのがめっちゃ面倒いので、だいたいこんなものかなぁ、というのしかわからなかったがそれが肌で知れて、自分のお金がそういた類いのことに使われているというのを知れるのもうれしいし、なにより、司政に対して批判的な眼を保ち続ける機会を増やしてくれるという相乗効果も期待できそうだ。どんな高尚なことを語っても、最後は市民ひとりひとりの厳しい眼と投票と言うアクションでしか、世間は変わらないから、こうしたオープンデータにはめっちゃ期待してるし、
南三陸や横浜市とでは税金の使われ方が異なる。災害復旧費などに税金が使われているのが一瞬でわかる。(この一瞬が大事なんだな。)
5-1.
渡邊先生の活動の紹介。
東日本大震災時、地下鉄電車が止まり、トンネルを歩いて、トンネル内撮影、その後レインボーブリッジを封鎖して、歩いて帰った。入試業務でパソコンいじれない中、名も知らぬ見知らぬデータサイエンティストと協同して、原発と個人の家までの距離がわかるデータを3月11日から12日の間で作り、即座にローンチ(?使い方あってるかなw)した話は感動的だった。
進化心理学的に説明したいが、今回は水を差すので割愛しますw。
先生の研究室で、計画停電マップも停電の中で、再利用しにくいデータをひとつひとつ手で入力していると、北海道地図株式会社から自治体の境界のデータが提供される。うぅ、助け合い。うつくしい!!!ローンチされた停電マップは一週間で50万アクセスされた。ほんと、真に必要なものは絶対バズる!
人力でのオープンデータと記憶のコミュニティー。東日本大震災はソーシャルメディアのネット空間上で、顔を合わせずに作業。広島原爆アーカイブの方は顔を合わせて同空間、同時間を共有して作業していた。
6-1.
東日本大震災当時、本田技研のホンダの車の通り道データにグーグルアース用のデータを重ね、さらに炊き出しや、緊急避難所のデータをマッピングした話。なんか、ここらへんに来ると、だんだん渡邊先生がタカ&トシから功徳を施す僧侶、もしくは厳しい修行を自らに課す阿羅漢に見えてきたwww
もし、ブッダの弟子が今、生きてたら、間違いなくデータサイエンティストになっていたと俺は確信する。人助け、人の幸せ、身近な人に手を差し伸ばすことも大事だし、遠くの名も知らぬ人に手を差し伸べることも大事。適材適所。各々の個性のままに善を為せ。
被災地へ支援力の物資を届けるときに、さきほどのマッピングデータを見る。グレーの色は通れるか定かではない。青色の道は通行可能。そのため。その安全な道を通って物資が輸送される。
また、悲惨な状況を伝える写真ばかりに違和感を抱く。これもツバルヴィジュアリゼーションと同じで、東日本大震災においても、ツバルと同じように世界から注目が集まった。現地の人々はどんな暮らしを送っているか、どんなことを考えているのか、気になるところ。気になっちゃう感じですかぁ?(柳原加奈子風)
津波被害の大きかった南三陸町戸倉長清水では被災地直後にもかかわらず、被災者の証言を地元の学生が集めデジタルアーカイブ化している。グーグルアースで見る、マッピングの中の青い円は当時のツイートが、グーグルアースと言うもうひとつの地球にしっかと刻まれている。みんな生きてるか、という生の声。
一ノ瀬健太
①ビッグデータは人を幸せにする。
②位置情報は諸刃の剣!
③名もなき民の、人類への無意識的貢献
お!なかなかいい記事じゃん!と思われた方はアマゾンでお買い物♪