フェイスブックでの言葉遣いからうつ病を予測

m3.com
AI Lab
ニュース
フェイスブックでの言葉遣いからうつ病を予測

AI Lab プロジェクト医療×AIの発展にご協力いただける方を募集しています

プロジェクト一覧

フェイスブックでの言葉遣いからうつ病を予測

2018年10月31日（水）

AIに関連する医学論文をご紹介します。

» 連載1回目から読む

フェイスブックへの投稿の言葉遣いを分析することで、うつ病の発症を予測できることを米国・ペンシルベニア大学のJohannes C. Eichstaedtらが示した。

都市にある救急医学の研究部門に通院している683人、うつ病の診断歴がある114人と対照群を対象に、フェイスブックへの過去の投稿の言葉遣いを調べたところ、既存のスクリーニング検査とほぼ同等の正確さでうつ病患者を判別することができた。最初の診断から過去6ヶ月に限定して投稿を分析するとさらに予測精度は高まり、診断よりも最長で3ヶ月前に発症を予測することができた。うつ病の予兆とされる言葉遣いには、感情（悲しみ）、対人関係（孤独や敵意）などに関連するものが特徴的に現れるという。ソーシャルメディアを活用した日常生活に溶け込んだうつ病の早期発見は、患者のプライバシーの保護やデータの保護などの課題はあるものの、同意が得られれば多数の人を対象にでき、既存のスクリーニング検査やモニタリング手法を補完できる検査手法になる可能性があるとしている。PNAS誌2018年10月15日オンライン掲載の報告。

研究グループはまず、うつ病と診断された114人の場合は診断日よりも前、対照群は同等期間についてのフェイスブックの投稿内容、投稿の長さ、頻度、投稿時間の傾向、属性を使って機械学習により予測モデルを作成した。各患者について、この予測モデルで算出されたうつ病の可能性と、カルテ上の実際の診断の有無を比較した（10分割交差確認）。閾値ごとの偽陽性率と敏感度を算出し、受診者動作特性（ROC）曲線を描いた。予測精度は曲線下面積（AUC）で評価した。

文章中の特定の言葉の使用頻度をもとに、latent dirichlet allocation （LDA）と呼ぶ手法を使って200の話題を選び出し、その話題が投稿に登場する頻度からうつ病の発症を予測するように機械学習でモデルを作成したところ、AUC＝0.69となった。十分な識別能があると評価される0.70にわずかに足りないものの、一定の精度があるという結果となった。また、投稿の長さや頻度などほかの特徴を使った予測精度はAUCが0.60に届かず、言葉遣いと組み合わせても予測精度は向上しなかった。アンケート調査の自己申告によるスクリーニングを診療記録を照合した過去の研究と比較しても、同等の精度が達成できているという。

診断が下されるどれくらい前にうつ病の発症をとらえられるかについても研究チームは調べた。6ヶ月を１区間として過去７区間について遡ってモデルを使って予測したところ、診断時期に近づくほど精度が向上し、直近の６ヶ月ではAUC=0.72となった。また、将来うつ病になる可能性を限界の精度（AUC=0.62）で偶然ではない（P=0.0002）といえる範囲で予測する場合、診断時期の約3ヶ月前まで遡ることができた。予測精度としてはさほど高くはないが、ほかの負担が少ないデジタル技術を使ったスクリーニング手法と組み合わせれば、早期の予兆発見や不調期間の短縮につなげられる可能性があると研究チームは見ている。

どのような言語の特徴が予兆に役立つかをより詳しく理解するために、LDAで選び出した200の話題について、うつ病と診断された人と診断されない人の違いを調べた。年齢や性別、人種の違いを取り除いたところ、落ち込んだ気分や気持ち、孤独感、敵意、体の不調、医療関係に分類できる10の話題が特に将来のうつ病診断と関連があることが分かった。多重検定の補正をBenjamini-Hochberg法でした後は7つの話題が統計的に有意（P < 0.05）だった。具体的な言葉について調べると、落ち込んだ気分を話題にするときの言葉（tears, cry, pain）、孤独に関連する言葉（miss, much, baby）、敵意に関連することが（hate, ugh, fuckin）がうつ病と診断される人では特徴的に現れていた。ほかにも負の感情や悲しみに関連する言葉で同じ傾向がみられた。