本気で匿名性を保つために留意すべきこと
メタデータは忘れず消す
文書形式によっては、作成者や作成時間がメタデータとして残っていることがある。先に出てきたサトシ・ナカモトに関しても、有名なBitCoin論文のPDFメタデータに残っていたタイムゾーン情報から、住んでいる地域を特定しようという試みがあった。画像も、撮影場所や撮影者の情報がEXIFとして残っていることがある。こうしたものを消すウェブサービスなどもあるようだが、誰が運営しているか分からないので、やり方を調べて自分の手で削除したほうがよい。
文体から個性を抜く
ロバート・ガルブレイスと名乗るイギリスのミステリー作家がいた。2014年、この人の正体が実は「ハリー・ポッター」シリーズで有名なJ.K.ローリングだという情報が新聞社に寄せられ、この新聞社に委嘱された研究者がガルブレイスの小説の文体や語彙を計量的に検討したところ、ローリングと同一人物である可能性が極めて高いとされ、結局ローリングも認めるという事件があった。
無くて七癖というが、文章からは知らず知らずのうちに個性がにじみ出てしまうもので、自分しか使わない言い回しや単語が必ずある。それらを計量的に分析し、年齢や学歴など、文章の著者に関する情報を探るのがいわゆる法言語学(forensic linguistics)だが、コンピュータや機械学習の進歩と相まって、近年この分野の進展はめざましい、サンプルさえ十分にあれば、著者は大体分かってしまうようだ。とすれば、plausible deniabilityという意味では、誰でも書ける、無個性な文体を意識的に採用する必要がある。
といっても言うは易く行うは難しで、あくまでコツ程度のことしか私にも言えないのだが、まず重要なのは、できるだけ易しい語彙しか使わないということである。難しい語彙や漢字、フレーズは多くの場合他の人は使わないわけで、特定される可能性が高まる。また、英単語の綴りに英国式と米国式があるように、日本語でもある地域でしか使われていない言葉は多くあるので、特に注意しなければならない。
ことわざや故事成語、専門用語、スラング、そして特に略語は、著者が育った、あるいは今もその中で過ごしている文化と密接に関係するので、できるだけ避けたほうがよい。一文はできるだけ短くし、当て字、体言止め、間接話法、書き間違いなども特徴量となり得るので注意する。句読点や括弧の種類、段落の字下げ、箇条書きの見出しなども、普段使っているものとは変えたほうがよいだろう。具体的には、漢字は常用漢字のみ使い、表記等は自分の好みではなく共同通信社の「記者ハンドブック」に準拠するのが良いかと思う。
伝家の宝刀としての匿名性
私自身は、現在のインターネットには匿名性が足りず、そのことが情報の中央集権化に拍車を掛けてしまっていると感じており、ネットの標準的な仕組みとして、様々な形で匿名化技術を普及させていく必要があると考えている。一方で、匿名性というのは人間を無防備にするものなので、年がら年中匿名で書くのではなく、いわば「伝家の宝刀」として使ってもらいたいという気分もある。
これまで述べてきたように、実際に匿名性を保つのは容易ではなく、本気でやるなら偏執的な配慮が必要だ。ただ、伝家の宝刀である以上、それは優秀な情報機関等の追及にも耐えられるレベルの、真の匿名である必要があると私は思うのである。
・ヤフー個人から転載
この筆者のコラム
陰謀論信じる反マスク派がソーシャル・ディスタンス主張、別の陰謀論が流された? 2021.05.21
本気で匿名性を保つために留意すべきこと 2019.03.27
ウェブで社会を動かす? その強さと脆さ 2019.03.18
インターネットは、国単位で分割される「スプリンターネット」になりつつある 2019.03.15
我々の弱点を前提として、民主主義を「改善」することはできないだろうか 2019.03.11
Facebookとファクトチェックという難問 2019.03.05