研究シーズResearch Profiles
複数の多様なデータの結合と利用
データリンケージ、統計的マッチングに関する研究
プロフィール
データサイエンス学部 データサイエンス学科 教授:高部 勲 Takabe Isao
総務省統計局、独立行政法人統計センター等を経て、令和3年4月に立正大学データサイエンス学部教授に就任。博士(統計科学)。専門は公的統計、統計科学。統計検定(1~4級、準1級、専門統計調査士、国際資格等)、専門社会調査士、ディープラーニングG検定等の資格を取得。
複数の多様なデータを結合
異なるデータを結合し、情報量が多く様々な分析が可能なデータを作成
- 目的
- 情報量が多く付加価値の高いデータの作成
近年,インターネット上の情報,公的統計ミクロデータなど様々なデータが利用可能となっています。これらを統合できれば,新たにデータ収集を行うことなく,情報量の多い有用なデータが得られると期待されます。公的統計ミクロデータやビッグデータをレコード単位で結合する方法の研究により、有用なデータベースの作成方法の確立を目指します。
- 内容
- データサイエンスの手法を活用したデータの結合に関する研究
多項ロジットモデルなどのデータサイエンスの手法を活用し、複数のデータベースをレコード単位で結合する方法を開発。これにより、豊富な情報を持つ単一のデータベースを構築。新たな調査・データ収集を行うことなく情報量の多いデータベースを構築することが可能。
- 展望・成果
- 秘匿性・安全性を考慮したデータの結合
研究開発を行っている手法では、データを結合するのみならず、各データのレコードの一致に関するマッチング確率を算出することが可能。このマッチング確率を基に、マッチングの可否を判定するとともに、レコードに対して適切な秘匿処理を実施し、データの秘匿性・安全性を考慮した上で統計的マッチングを行うことも可能となります。
- キーワード
-
#データサイエンス学部、#データリンケージ、#統計的マッチング、#公的統計ミクロデータ
- 研究者からのメッセージ
-
適切な標本設計の下に作成・提供される公的統計ミクロデータと、ボリュームや速報性に優れたビッグデータを結合することにより、正確性と量を兼ね備えたデータの作成が可能になるなど、既にあるデータの価値を生かす、有用なデータの作成に役立つ手法を研究しています。