最新記事

ネット

「ネット言論のダークサイド」を計算機で解析する ── データ分析による報道の技術とその再現性 ──

2016年5月10日(火)22時31分
大野圭一朗


欧米メディアのGitHubレポジトリ
The Guardian
The New York Times
ProPublica
ICIJ
Los Angeles Times

調査報道と再現性

 科学の世界では当たり前なのですが、ジャーナリズムの世界でも、このようなデータ解析を使った報道というものの出現に伴い、そのプロセスの透明性と再現性といった点が話題になっています。英語ですが、興味のある方はこのあたりの記事を読んでみてください。
The Need for Openness in Data Journalism
The Rise of Transparent Data Journalism

解析の再現性には幾つかのレベルがあります:

1.機械可読な形でのデータの公開
2.解析に使った手法とそのソースコードの公開
3.解析に使った環境の公開

1はともかく、2と3はかつては技術的になかなか難しい面もありました。しかし、現在では公開されたソースコードの事実上の標準レポジトリであるGitHubがありますし、解析の規模にもよりますが、解析環境をコンテナ技術(Dockerというソフトウェアがもっとも普及しています)を用いて第三者が再現可能な形で残すこともできます。このように、技術的に解決出来る面も増えてきていますので、調査報道の分野を中心に、今後はこういった方向を目指すメディアも増えるのではないかと思います。

 また、こういった話題で必ずと言っていいほど出てくるJupyter Notebookというツールですが、これは人間のための文章や図表と、計算機で実行できるコードを混在させて、実際にそれを実行しながら動作を確認できるという非常に強力なツールです。報道では、解析に使ったコードを読者に実際に手元のマシンで実行させながら読んでもらうということが可能になります。これについてもいずれ最近の傾向をまとめたいと思いますが、使うこと自体は決して難しくないので、少しでもプログラミングのできる方はぜひ試してみてください。

gardians13.jpg


余談: 日本のメディアの方へのささやかな要望
 GitHubにウェブ版の紙面で使ったコードを公開することで問題が発生するケースはまず無いと思います。報道機関のパフォーマンスはあくまでその内容で競われるべきものなので、ソースコードの質ではないはずです。したがって、こういった競う必要性が低い部分での横の協力が進めば、日本の報道機関全体の技術的な面での底上げにつながるのではないでしょうか。第一歩として、まずはGitHubのレポジトリをプライベートからパブリックに移行するところから始めてはどうでしょう?

報道への機械学習と自然言語処理の応用

 今回の解説記事の最後にこんな一文があります。


In the future, we would like to explore the words used in the comments, using standard and bespoke natural language processing algorithms.

将来的には、我々は標準的なものからカスタムのものまで、各種自然言語処理アルゴリズムを用いて、コメントの内容そのものを調査してみたい。


 コメント欄というのは自然言語(英語)で書かれています。つまり今回見たような単純な手法ではその傾向を分析するのは困難です。ここをさらに深く掘り下げるには、自然言語処理、もっと言えば人工知能関連の技術の応用が必要になります。人工知能に関しては驚くほどのハイプが出回っていますが、少なくとも現時点での人工知能関連技術というのは非常に便利な道具に過ぎません。しかし適切に使えばデータ分析に大変な力を発揮します。

 簡単な例ですと、今回の記事では男女の差に着目して解析を行っていましたが、これがもし人種だったらどうでしょう? プロフィールにいちいち人種を書くということはまずありえないので、何らかの推測に基づいた判別が必要になります。仮に元のデータに著者の近影が存在した場合、適切にトレーニングした分類器を用いれば、東アジア系、中東系、アフリカ系、ヨーロッパ系などに大雑把な分類するのは、今の機械には決して不可能ではありません。

 今後そういった技術を持った人々が報道の世界で働くということも十分に考えられるシナリオだと思います。

まとめ

 このように、実際のデータ解析作業というのは、かなり地道な作業が多く、メディアを賑わす数々のバズワードのイメージとは若干ズレがあると思いませんか? 一方、様々な技術が導入されている今日の報道ですが、まだまだ改善の余地があります。特にデータの高度な分析には統計解析の専門家の力が欠かせませんし、ソーシャルメディアでの言論などを大規模に解析するには、自然言語処理の専門家などが必要です。他の多くの分野と同じく、ジャーナリズムの世界にも最新技術による革新を起こせる可能性が広がっています。道具は揃ってきました。あとはやるかやらないかだけです。

 私はジャーナリズムとは全く関係のない完全なアウトサイダーですが、科学分野に関わる仕事をしておりますので、データの分析やそのプロセスの透明性といった部分で、新たなスタイルの報道と科学の類似性を感じています。すなわち、最新技術を特定分野に応用するための分野を超えた協力関係です。これらに関連する諸問題は、技術的な面と人的な面の両面からアプローチしないとなかなか解決できません。このような複雑な問題に向かい合う場合、分野を超えた交流が重要だと考えており、少しでもこういった分野に目を向ける人が多くなり、新たなコラボレーションが生まれてくれれば、と願っております。

Keiichiro Ono (大野圭一朗)
4/17/2016

CC BY 4.0
質問などはkono at ucsd eduまでお願いいたします。

※当記事は大野圭一朗氏のMediumのブログ記事を転載したものです。

今、あなたにオススメ
ニュース速報

ビジネス

ANA、エアバス機不具合で30日も6便欠航 2日間

ビジネス

アングル:「AIよ、うちの商品に注目して」、変わる

ワールド

エアバス、A320系6000機のソフト改修指示 A

ワールド

アングル:平等支えるノルウェー式富裕税、富豪流出で
今、あなたにオススメ
MAGAZINE
特集:ガザの叫びを聞け
特集:ガザの叫びを聞け
2025年12月 2日号(11/26発売)

「天井なき監獄」を生きるパレスチナ自治区ガザの若者たちが世界に向けて発信した10年の記録

メールマガジンのご登録はこちらから。
人気ランキング
  • 1
    100年以上宇宙最大の謎だった「ダークマター」の正体を東大教授が解明? 「人類が見るのは初めて」
  • 2
    7歳の息子に何が? 学校で描いた「自画像」が奇妙すぎた...「心配すべき?」と母親がネットで相談
  • 3
    128人死亡、200人以上行方不明...香港最悪の火災現場の全貌を米企業が「宇宙から」明らかに
  • 4
    子どもより高齢者を優遇する政府...世代間格差は5倍…
  • 5
    「999段の階段」を落下...中国・自動車メーカーがPR…
  • 6
    【クイズ】世界遺産が「最も多い国」はどこ?
  • 7
    【寝耳に水】ヘンリー王子&メーガン妃が「大焦り」…
  • 8
    【最先端戦闘機】ミラージュ、F16、グリペン、ラファ…
  • 9
    香港大規模火災で市民の不満噴出、中国の政治統制強…
  • 10
    インド国産戦闘機に一体何が? ドバイ航空ショーで…
  • 1
    インド国産戦闘機に一体何が? ドバイ航空ショーで墜落事故、浮き彫りになるインド空軍の課題
  • 2
    膝が痛くても足腰が弱くても、一生ぐんぐん歩けるようになる!筋トレよりもずっと効果的な「たった30秒の体操」〈注目記事〉
  • 3
    【最先端戦闘機】ミラージュ、F16、グリペン、ラファール勢ぞろい ウクライナ空軍は戦闘機の「見本市」状態
  • 4
    7歳の息子に何が? 学校で描いた「自画像」が奇妙す…
  • 5
    海外の空港でトイレに入った女性が見た、驚きの「ナ…
  • 6
    マムダニの次は「この男」?...イケメンすぎる「ケネ…
  • 7
    100年以上宇宙最大の謎だった「ダークマター」の正体…
  • 8
    老後資金は「ためる」より「使う」へ──50代からの後…
  • 9
    【クイズ】次のうち、マウスウォッシュと同じ効果の…
  • 10
    「髪形がおかしい...」実写版『モアナ』予告編に批判…
  • 1
    【クイズ】本州で唯一「クマが生息していない県」はどこ?
  • 2
    東京がニューヨークを上回り「世界最大の経済都市」に...日本からは、もう1都市圏がトップ10入り
  • 3
    一瞬にして「巨大な橋が消えた」...中国・「完成直後」の橋が崩落する瞬間を捉えた「衝撃映像」に広がる疑念
  • 4
    「不気味すぎる...」カップルの写真に映り込んだ「謎…
  • 5
    【写真・動画】世界最大のクモの巣
  • 6
    高速で回転しながら「地上に落下」...トルコの軍用輸…
  • 7
    「999段の階段」を落下...中国・自動車メーカーがPR…
  • 8
    まるで老人...ロシア初の「AIヒト型ロボット」がお披…
  • 9
    「髪形がおかしい...」実写版『モアナ』予告編に批判…
  • 10
    膝が痛くても足腰が弱くても、一生ぐんぐん歩けるよ…
トランプ2.0記事まとめ
日本再発見 シーズン2
CHALLENGING INNOVATOR
Wonderful Story
MOOK
ニューズウィーク日本版別冊
ニューズウィーク日本版別冊

好評発売中