以下の記事が面白かったので、簡単にまとめました。 「Vision Language Model」は、画像とテキストの入力を受け取り、テキスト出力を生成する生成モデルの一種です。LLMは、優れたZero-Shotを備え、汎化が容易で、ドキュメントやWebページなどを含むさまざまな ...
PFNは、PLaMoシリーズを継続的にアップデートしており、2026年1月中に最新モデルとなるPLaMo 2.2 Primeを提供予定です。最新版のPLaMo 2.2 Primeでは日本語・英語の両言語における指示追従性能(Instruction ...
ダウンロード用画像に誤りがありましたので、差し替えました。 すべての画像3枚目「SparseVLM」の構成と処理(採択論文より引用) パナソニックR&Dカンパニー オブ アメリカ(以下、PRDCA)およびパナソニック ホールディングス株式会社(以下 ...
人工知能(AI)の進化は、私たちの生活や産業に革命的な変化をもたらしています。特に近年注目を集めているのが、視覚情報と言語情報を統合し、物理的な行動を生成するVision-Language-Action Model(VLA)です。このモデルは、ロボットが人間のように世界を ...
サイバーエージェントは、生成AIとして75億パラメータの日本語VLM(Vision Language Model、大規模視覚言語モデル)を公開した。 近年、OpenAIが開発した「GPT-4o」を始め、画像も扱えるLLMが急速な進化を遂げ、世界中のあらゆる業界・ビジネスにおいて活用が進んで ...
LLMを用いた高精度自動同時通訳システムの実用化を目指す TOPPANホールディングスのグループ会社であるTOPPAN株式会社(本社:東京都文京区、代表取締役社長:大矢 諭、以下 TOPPAN)は、大規模言語モデル(Large ...
Metaがコードをコンパイルしつつ最適化するという大規模言語モデル「Meta Large Language Model Compiler」をリリースしました。モデルは商用利用可能で、Hugging Faceにてホストされています。 Meta Large Language Model Compiler: Foundation Models of Compiler Optimization | ...
会員(無料)になると、いいね!でマイページに保存できます。 生成AI領域における言語モデルは今、いくつかの方向で開発が進められている。 その1つは「大規模言語モデル(LLM)」の開発。大規模言語モデルは、生成AIの代名詞的な存在で、文字どおり ...
グーグルは3月14日(現地時間)、大規模言語モデル(LLM)「PaLM」のAPIを発表。当面はプライベート・プレビューを通じて一部の開発者のみに提供されるが、近日中にウェイティングリストも公開されるという。 パラメーター数は最大5400億 PaLM(Scaling Language ...
AIツールの導入による人員削減は、コスト削減や業務効率化をもたらすどころか、かえって労働者の仕事を増やし、顧客の信頼を損ない、大きな混乱を招く。そんなことに経営者たちは気づくだろう。 Security AIのプロンプトを“詩”にするだけで、核兵器の ...
「見るAI」から「現場を理解し考えるAI」へ 生活総合支援サービスを展開するHITOWAグループで、有料老人ホーム「イリーゼ」を運営するHITOWAケアサービス株式会社(本社:東京都港区、代表取締役社長 須原 清貴、以下「HITOWAケアサービス」)と、Vieureka株式会社(本社:大阪市中 ...
東京を拠点とするAIスタートアップのSakana AIは2月20日、AIを活用することでさらに効率的なAI開発を可能にするエージェント「AI CUDA Engineer」を発表した。GPUへのコード最適化で処理速度が10倍〜100倍になるという。 スタンフォード大学の心理学者ミハル・コ ...