分析研究者らは、Twitter 投稿の位置情報メタデータを使用して、ユーザーの自宅住所、職場、訪れた機密の場所などの個人情報を推測できることを再び実証しました。
ギリシャの研究技術財団と米国のイリノイ大学に所属するコンピュータサイエンスの専門家、コスタス・ドラコナキス氏、パナギオティス・イリア氏、ソティリス・イオアニディス氏、ジェイソン・ポラキス氏は、2月に開催されるネットワークおよび分散システムセキュリティシンポジウムで発表される予定の「去年の夏、私がどこにいたか忘れてください:公開位置情報(メタデータ)データのプライバシーリスク」と題する論文で研究結果を発表しました。
「位置情報メタデータによって、幅広いシナリオ(例えば、抑圧的な政権が活動家のアカウントを匿名化することから、保険会社が顧客の健康問題を推測すること、潜在的な雇用主が身元調査を行うことまで)で悪用される可能性のある機密情報の推測が可能になることを示した」と研究者らは論文で主張している。
Twitterの位置情報データに関連するプライバシーリスクは、2015年に発表された学術研究で調査されており、Twitterはその後、ユーザーによる位置情報データの制御を強化し、記録される座標の精度を制限してきました。現在、正確な位置情報の提供はデフォルトで無効になっており、位置情報を共有するにはユーザーのオプトインが必要です。
「アカウント所有者はツイートする際に位置情報を共有することを選択している」とツイッターの広報担当者は月曜日、ザ・レジスター紙への電子メールで述べた。
これはオプトイン方式です。ユーザーの許可なくツイートに位置情報を添付することはありません。ユーザーがツイートで位置情報を共有することを選択した場合、その位置情報は当社のAPI経由でも提供されます。繰り返しますが、これはユーザーがオプトインした場合のみ有効です。
多少の進歩はあるが、まだ十分ではない
しかし、Twitterの変更はプライバシーリスクの軽減には繋がっていません。同社は開発者APIを通じて位置情報の履歴データを提供し続けているからです。2015年4月以前にリリースされたAndroidおよびiOS向けのTwitterモバイルアプリでは、低精度の位置情報ラベルが付けられたツイートに、正確なGPS座標がメタデータとして自動的に含まれていました。
「収集したデータセットでは、粗い位置情報ラベル(例:都市名)が付いたツイートには、2010年まで遡ってメタデータにGPS座標も含まれていることがわかりました」とポラキス氏は述べた。「2015年4月以降、粗い位置情報ラベルが付いたツイートが登場し始めましたが、メタデータにGPS座標は含まれなくなりました。これは、その頃にTwitterアプリに変更があったことを示しています。」
研究者らにとって、正確な位置情報の組み込みを許可したTwitterのポリシーは、対処すべきプライバシーの問題を呈している。
「このプライバシー侵害はユーザーには見えません。GPS座標はAPIから返されるメタデータにのみ含まれており、Twitterのウェブサイトやアプリからは確認できないからです」と論文は説明している。「さらに悪いことに、この過去のメタデータは現在もAPIを通じて一般公開されています。」
位置情報データは企業にとって課題となっている。広告ターゲティングにおいて非常に価値の高い情報であるため、企業は位置情報の開示を躊躇し、その利用方法について十分な説明をしない傾向があるようだ。先週、ロサンゼルス市検事はIBM傘下の気象予報会社に対し、同社のウェザーチャンネルアプリを通じて収集された位置情報データの利用方法を適切に開示していないとして訴訟を起こした。
Twitterユーザーにとって、問題はプライバシーです。この論文では、起こり得るリスクを概説するために、Twitter上で医師に関する否定的な発言をしたユーザーが、その人物を精神科医の診察室に誘導した事例を紹介しています。また、リハビリセンターのジオタグをつけたツイートで、血液検査について不満を述べたユーザーの事例も紹介しています。
共有しない方が良いツールもある
研究者たちは研究の過程で、ツイートの位置情報メタデータを調べて機密性の高い個人情報を推測する「LPAuditor」と呼ばれる位置情報データ監査ツールを開発し、テストした。
このツールは公的にアクセス可能な位置情報データベースに依存しており、悪用される可能性があるためオープンソース化されないだろうと、論文の共著者の一人であり、イリノイ大学シカゴ校のコンピュータサイエンス助教授ジェイソン・ポラキス氏はThe Registerへの電子メールで述べた。
このソフトウェアは、これまでに実証された技術よりもはるかに正確に、住宅や職場に関連する場所を特定することができます。
「私たちのシステムは、ユーザーの92.5%と55.6%の自宅と職場を特定できる」と論文には記されている。
研究者らによると、これは過去に実証されたものと比べて、家庭では18.9~91.6%、職場では8.7~21.8%精度が高いことになる。
ポラキス氏と彼の同僚は、「ユーザーの71%が機密性の高い地域からツイートしており、そのうち27.5%はツイートの内容から高い確度でその地域に位置付けられる」ことを発見した。
研究者によると、ユーザーが位置情報の公開を選択できる場合、GPS座標がタグ付けされたツイートが94.6%減少するという。研究者たちは、このような統計データは、ユーザーが位置情報を制御できるようにするメリットを強調していると主張している。しかし、位置情報の制御は遡及的ではない。開発者は現在、Twitter APIを通じて過去数年分の位置情報データにアクセスできる。
Facebookは非ユーザーの追跡を彼らの利益のために行っていることを認めている
続きを読む
調査データセットに含まれる29万162人のユーザーのうち、8万7114人が公式TwitterアプリとFoursquareアプリを通じて位置情報タグ付きツイートを投稿しました。研究者らは、他のサードパーティ製アプリは考慮していません。「Twitterの位置情報ガイドラインは強制力も執行力もないため、サードパーティ製アプリは位置情報データを異なる方法で処理する可能性がある」と研究者らは述べています。
研究者たちはTwitter APIを用いて、ユーザーデータセット内の約30%の正確な位置情報データを見つけることができました。研究者らによると、このようなデータの公開を許可したTwitterのポリシーにより、「主要な位置情報をシステムで正確に特定できるユーザーの数が約15倍に増加した」とのことです。
データベースには何が含まれていますか?
第三者がTwitterユーザーの明確な同意なしにこのデータを収集し、保存している可能性があるという事実は、ポラキス氏にとって懸念すべきことだ。
「ユーザーが明確に認識していない(あるいは防ぐことができない)まま、膨大なデータが収集され、第三者に共有・販売されています」と彼は述べた。「たとえ第一者がそのようなオプションを提供しているとしても、ユーザーが第三者のデータベースからデータを削除する手段を持たない場合、それは確かに問題です。」
同氏は、自身が法学者ではないことを念頭に置きつつも、研究結果と位置データから推測できる内容の機密性を考慮すると、そうしたデータについては法律を制定したり、より明確な監視を行ったりすることが合理的かもしれないと述べている。
「大手企業が位置データを収集し共有する方法が変化し、よりプライバシーを保護するアプローチが採用されることを期待しています」と彼は述べた。
「私たちの研究が、ユーザーがウェブサービスや他のユーザーと位置情報データ(意図的であろうと無意識であろうと)を共有する際に直面するリスクについて、ユーザー教育に役立つことを願っています。位置情報データを使って誰かがあなたについて何を推測できるかを知ることは、オンライン活動においてより慎重になる大きな動機となるでしょう。」®