研究推進

機械学習による自然言語、画像の解析

003_hiroshi-uehara

プロフィール

データサイエンス学部 データサイエンス学科 教授:上原 宏 Hiroshi Uehara

前職が秋田の大学だったので、美味しい日本酒が好きになりました。

自然言語解析および画像認識

言語、画像データを対象に機械学習でルールを見つけ出す研究

物体検出学習用バウンディングボックスの自動生成の例
目的
機械学習の実社会への応用

機械学習の様々なアルゴリズムを用いて、自然言語、画像データから知識を獲得すること。

内容
口コミビッグデータの解析、およびコンピュータビジョン向け訓練データ自動生成

1.自然言語解析
旅行サイト、レシピ投稿サイトから収集した大量のテキストデータを用いて、観光スポット推薦や新しいレシピの生成などを手掛けております。
2.画像解析
自動運転等で利用される物体検出の学習用に必要なバウンディングボックスと呼ばれる手書きの訓練データを自動生成する研究をしております。

展望・成果
自然言語、画像データを対象とする機械学習アルゴリズムの産業利用

1.投稿レシピの解析
アップルパイとタルトタタンのレシピをもとにそれらのハイブリッドレシピを機械学習で生成する研究を行い、国際会議でbest paper awardを受賞しました。投稿レシピには、順序性が不明確な記述や、手順の欠落などが頻繁に見られますが、これを自動検出して必要情報を補完する研究を進めております。
2.旅行サイト口コミからのインバウンドツーリスト向け観光スポット推薦
世界最大の旅行サイトの口コミから日本を訪れる外国人向けに、あまり知られていない観光スポットを推薦するアルゴリズムを研究しております(昨年から今年にかけて国際会議で3本の論文発表をしました)。
3.物体検出学習用バウンディングボックスの自動生成
学習用バウンディングボックスは現状、手作業に拠っておりますが、これを自動生成するアルゴリズムの研究をしております(昨年から今年にかけて国際会議で2本の論文発表をしました)。この技術は主に自動運転で利用されてりますが、今後、医用画像を始めとして様々な産業利用ニーズに応えるようにアルゴリズムの性能向上を目指します。

  • 物体検出学習用バウンディングボックスの自動生成の例

    物体検出学習用バウンディングボックスの自動生成の例

  • award

    award

キーワード

#データサイエンス学部、#機械学習アルゴリズム、#産業利用

研究者からのメッセージ

機械学習の産業利用が始まっていますが、その普及にはまだ多くの課題があります。いろいろな産業分野に携わられている方々からニーズをお聞きし、機械学習の実利用でどのような貢献ができるのかご一緒に考えながら進めたいと考えております。

ページの上部へ