無料会員登録

キャリア・マム 理化学研究所 関根氏を特別講師に迎え セミナーを開催!LLMの精度に直結するデータを解説

~事例紹介 LLMモデル活用を成功に導くポイントを徹底解説~

株式会社キャリア・マム(本社:東京都多摩市、代表取締役:堤 香苗)は、2024年7月23日に自然言語処理、LLM構築の先駆者である理化学研究所の関根 聡 氏を特別講師に招き、ウェビナー「生成AI LLM構築セミナー ~インストラクションチューニングデータ作成時のポイントとその事例~」を開催します。


バナー


理化学研究所は、2023年より複数企業との共同研究「LLMのための日本語インストラクションデータ作成プロジェクト」を掲げ、そのデータ制作数は2024年2月末日に1万件に到達。キャリア・マムは、インストラクションデータ制作外注先3社のうちの1社として制作に参加し、広く一般的な質問とそれに対する適切な回答を担当。質の高い日本語に特化したインストラクションデータを作成しました。


実用的な大規模言語モデル(LLM)の構築には、モデルの精度を大きく左右するいくつかのポイントがあります。そのひとつがインストラクションデータの妥当性であり、LLM構築時には、適切なデータの基準を正しく見極め、揃えることを重要視すべきです。


当セミナーでは、今回の開発を具体的な事例とし、インストラクションデータを制作する際に基準となる事項や度合いについて関根氏が解説、後半はパネルディスカッション形式で、データの作成やチューニングに関するコツ、アノテーターに必要な資質や進化していくLLMについて、ご紹介します。


関根氏の解説は、LLM構築におけるインストラクションデータの重要性やデータ作成時のポイントはもちろん、言語AIの最新動向、貴社ビジネスへの適用・応用について知見を得る好機です。AI開発者やビジネス戦略担当者にとって、貴重な情報を得る時間となるでしょう。

また、キャリア・マムがLLMのインストラクションデータ作成を担当できる理由や独自のメソッドは、お客様の新たな気づきの糧となり、事業戦略立案・イノベーション創出をアシストします。



【セミナー概要】

名称  :生成AI LLM構築セミナー

     ~インストラクションチューニングデータ作成時のポイントとその事例~

開催日時:2024年7月23日 12:00~12:55

会場  :オンライン開催

     (お申し込みいただいた方に、ウェビナーのURLをお送りいたします)

参加費 :無料


*お申し込みフォーム*

https://www.c-mam.co.jp/member/app.php?no=4239



【プログラム】

●第1部

1. LLM構築時のデータインストラクションの重要性と事例

2. LLM構築データの安全性確保の重要性とその考え方


【特別講師紹介】

国立研究開発法人理化学研究所 革新知能統合研究センター

言語情報アクセス技術チーム チームリーダー

関根 聡 氏(Ph.D.)


関根氏


大学卒業後に入社した松下電器産業株式会社(現・パナソニック株式会社)で、生涯のテーマとなる自然言語処理に出会う。その後、1992年に英国マンチェスター大学で修士号を、1998年にニューヨーク大学で博士号を取得後、2007年に同大学の准教授に就任。2024年4月からは情報学研究所LLM研究開発センター特任教授を兼任。自然言語処理技術のなかでも情報抽出、言語的知識獲得、言語解析などの分野で第一人者として知られる。



●第2部

パネルディスカッション「LLM構築時のデータ作成:インストラクションチューニング時のコツ」


インストラクションデータ作成時の事例に基づき、実際の調整内容や作成順序、段階などを紹介します。そのほか、キャリア・マムより納期に合わせた作成までのメンバーアサイン、研修方法、チェック方法などのコツを、理化学研究所 革新知能統合研究センター テクニカルスタッフ 後藤 美知子様より納品されたデータのチェック方法について解説。データ連携の重要性について、パネルディスカッション形式でお話します。


〈登壇者〉

理化学研究所 関根 聡 氏

理化学研究所 テクニカルスタッフ 後藤 美知子 氏

株式会社キャリア・マム 制作マネージャー 小尾 和美


〈ファシリテーター〉

株式会社キャリア・マム 代表取締役 堤 香苗


左から 後藤 美知子 氏、堤 香苗、小尾 和美

報道関係者向け
お問い合わせ先

@Press運営事務局までご連絡ください。
ご連絡先をお伝えいたします。
お問い合わせの際はリリース番号「401416」を
担当にお伝えください。