福岡工業大学
情報工学部 情報工学科 馬場研究室
自治体のビッグデータを活用し
介護や福祉といった行政施策に貢献
SNSやWebサイト、小説、俳句、文献など、私たちの身の回りはありとあらゆる文字情報であふれています。そんな膨大な情報(ビッグデータ)を解析し、そこから有益かつ新たな知見を発見する技術がデータサイエンスです。そして今、ビッグデータをビジネスの意思決定に生かす民間企業も増えている中、さらに大きな発展を期待されているのが、令和4年4月に施行した改正個人情報保護法による自治体の個人情報の利活用です。そんな大きな転換期とも言える中、全国でも先駆的に自治体と共同研究を行なっているのが福岡県古賀市と連携協定を結んだ福岡工業大学。研究を担うのは、情報工学部情報工学科の馬場謙介教授です。馬場教授がデータの先に見るのはどんな未来か̶̶。データと向き合う真摯な姿を追いかけます。
「伊藤園お~いお茶新俳句大賞」に検索技術を提供
私の研究室のテーマは、テキスト処理を中心とするデータサイエンス技術の開発です。検索や機械学習における理論的な研究に加え、実社会で解決や効率化が求められる問題を、データサイエンス技術を駆使して解決しています。そもそも“テキスト処理のデータサイエンス”とは何か。その例として、私が2016年より技術提供を行なっている事案をご紹介します。
飲料メーカー伊藤園が主催する「伊藤園お~いお茶新俳句大賞」は、毎年約200万句もの句が投稿される人気の俳句コンテストです。予備審査で選出された句は、既発表の句との重複確認が必要になります。かつて、この確認を人の手で行なっていましたが、作業効率を考え自動化することに。そこで、これまで世の中に発表された約100万の句を学習させた高度検索技術を提供しました。この検索技術では、句の単純な一致だけではなく、表記(ひらがなか漢字かなど)の違いや語の意味の近さも考慮。技術提供により作業効率化を図れただけではなく、審査員の負担も劇的に削減できました。今後の目標は、句に詠まれた情景の推定により、類似する句の検索精度を向上させること。そのためにも、語の背景にある歴史や慣習、感情など、日本語の豊かさに焦点を当て、さらに学習データを集める必要があります。この研究の先には、コンピューターが人の感情を理解する研究に繋がっていくはずです。
飲料メーカー伊藤園が主催する「伊藤園お~いお茶新俳句大賞」は、毎年約200万句もの句が投稿される人気の俳句コンテストです。予備審査で選出された句は、既発表の句との重複確認が必要になります。かつて、この確認を人の手で行なっていましたが、作業効率を考え自動化することに。そこで、これまで世の中に発表された約100万の句を学習させた高度検索技術を提供しました。この検索技術では、句の単純な一致だけではなく、表記(ひらがなか漢字かなど)の違いや語の意味の近さも考慮。技術提供により作業効率化を図れただけではなく、審査員の負担も劇的に削減できました。今後の目標は、句に詠まれた情景の推定により、類似する句の検索精度を向上させること。そのためにも、語の背景にある歴史や慣習、感情など、日本語の豊かさに焦点を当て、さらに学習データを集める必要があります。この研究の先には、コンピューターが人の感情を理解する研究に繋がっていくはずです。
要介護度など市民の将来の健康リスクを予測する
2022年11月には、市民に関するデータを分析、利活用して新しい行政サービスの創出を目指す試みとして、福岡工業大学と古賀市は連携協定を締結しました。その背景には、令和4年4月に施行した改正個人情報保護法における仮名加工情報の新設があります。仮名加工情報とは、氏名をID化するなどして、個人情報を他の情報と照合しない限り特定の個人を識別することができないように加工した情報のこと。今回の法改正により、行政に眠っていたビッグデータの利活用が一気に加速するとみられます。
今私たちは、古賀市から仮名加工情報の提供を受け、さまざまな業務の効率化を目指しています。現在取り組んでいることは、市民の要介護度の予測です。例えば、年齢や性別、医療費、通院歴などの情報をもとに解析を行い、“●年後に要介護になる可能性がある”といったリスクの予測が可能に。データの数が増え、さらに傾向が見えてくれば、早期に警鐘を鳴らすこともできます。予測の精度を上げていけば、貴重な予算を本当に必要な部分に効率的に充てることができる、という利点も。ただし、介護の必要性の判断というのは理屈だけで進む話ではありません。ご本人はもちろん、医師やご家族と話し合いの末に決定するものです。私たちの技術はあくまでも意思決定のための補助的役割。しかし、担う役割はとても大きいと思っています。
今後は、福岡工業大学に在籍するハードウェアの研究者と共同開発も視野に入れています。例えば、高齢者の方にウエアラブル端末を装着してもらい、そこで得たデータを今の研究に反映することで、さらに市民の暮らしや要望に合った行政サービスが生まれていくでしょう。今後、全国の市町村でビッグデータの利活用が進んでいけば、デジタルサイエンス技術が読み書きのように気軽に使われる未来も、そう遠くはないかもしれません。
今私たちは、古賀市から仮名加工情報の提供を受け、さまざまな業務の効率化を目指しています。現在取り組んでいることは、市民の要介護度の予測です。例えば、年齢や性別、医療費、通院歴などの情報をもとに解析を行い、“●年後に要介護になる可能性がある”といったリスクの予測が可能に。データの数が増え、さらに傾向が見えてくれば、早期に警鐘を鳴らすこともできます。予測の精度を上げていけば、貴重な予算を本当に必要な部分に効率的に充てることができる、という利点も。ただし、介護の必要性の判断というのは理屈だけで進む話ではありません。ご本人はもちろん、医師やご家族と話し合いの末に決定するものです。私たちの技術はあくまでも意思決定のための補助的役割。しかし、担う役割はとても大きいと思っています。
今後は、福岡工業大学に在籍するハードウェアの研究者と共同開発も視野に入れています。例えば、高齢者の方にウエアラブル端末を装着してもらい、そこで得たデータを今の研究に反映することで、さらに市民の暮らしや要望に合った行政サービスが生まれていくでしょう。今後、全国の市町村でビッグデータの利活用が進んでいけば、デジタルサイエンス技術が読み書きのように気軽に使われる未来も、そう遠くはないかもしれません。
高齢者向けの俳句チャットボットの開発
今後力を入れていきたいのは、高齢者ケアにおけるデータサイエンスの活用です。なかでも、高齢者の方が俳句を気軽に楽しめる「俳句チャットボット」の開発を考えています。これは世の中に発表された句を学習させたプログラムにより、句を詠むとその句に込められた情景や思いなどを汲み取り、感想を述べてくれるというもの。俳句は日本固有の文化です。文化を守りながら、気軽に俳句に取り組めるツールを開発していきたいです。
馬場 謙介教授
情報工学部 情報工学科
2002年九州大学大学院修了。同大学院にて助手を務めたのち、同大学准教授に就任。株式会社富士通研究所研究員、岡山大学教授を経て、2022年より現職。2015年にJSTデータサイエンス・アドベンチャー杯言語部門最優秀賞、2021年に山陽放送学術文化・スポーツ振興財団谷口記念賞を受賞。
2002年九州大学大学院修了。同大学院にて助手を務めたのち、同大学准教授に就任。株式会社富士通研究所研究員、岡山大学教授を経て、2022年より現職。2015年にJSTデータサイエンス・アドベンチャー杯言語部門最優秀賞、2021年に山陽放送学術文化・スポーツ振興財団谷口記念賞を受賞。