私たちの生活空間にロボットが溶け込み、家事を手伝い、高齢者を介護し、人間と協働する未来。それは長年、SFの世界で描かれてきた夢であり、ロボット工学が目指す究極の目標だ。工場で決められた作業を繰り返す産業用ロボットの時代は終わり、今 ...
プログラミング不要、日本語による指示で画像認識・制御コードもすべてAIが自動生成 株式会社チトセロボティクス(本社:東京都文京区、代表取締役社長:西田亮介、以下「当社」)は、大規模言語モデル(LLM)および視覚言語モデル(VLM)を活用した ...
この資料では、VLM(大規模視覚言語モデル)の基礎から、LLM(大規模言語モデル)とVLMの違い、開発ステップや業界・分野での活用事例など、詳細な情報をわかりやすくまとめています。 特に、画像を用いた検索・解析や、画像処理と言語処理を統合したAI ...
Google DeepMindは、論文でRobotic Transformer 2(RT-2)を紹介。RT-2、ウェブとロボティクスの両方のデータから学習し、この知識をロボット制御のための一般化された命令に変換する、新しい視覚言語アクション(VLA)モデルだ 大容量の視覚言語モデル(VLM)は ...
産業用ロボットのティーチングが生成AIで変わる。プログラミング不要、日本語による指示で画像認識・制御コードもすべてAIが自動生成する時代へ。 株式会社チトセロボティクスは「大規模言語モデル(LLM)」と「視覚言語モデル(VLM)」を活用した ...
ローカルで実行可能なQwen3-VL(8B)がOllamaライブラリに登録されたので、利用してみました。ただし、ollamaバージョンはプレリリース版(0.12.7rc0以降)を利用する必要があります。 VLMとは、Vision Language Modelで、大規模言語モデルに、視覚機能を持たせたAI ...
AIロボティクス・スタートアップの株式会社イーアイアイ(本社:東京都千代田区、代表取締役:胡浩、以下「イーアイアイ」)は、生成AIの一種である「VLM(視覚言語モデル)」を搭載し、飲料容器の高度な自動選別を実現する「生成AI活用型 飲料容器高度 ...
NVIDIAはロボット開発や自動運転車などの開発に役立つ仮想世界構築プラットフォーム「Omniverse」を展開しています。新たに、CGに関する国際会議「SIGGRAPH」の開催に合わせて、Omniverseのアップデートが発表されました。 NVIDIA Opens Portals to World of Robotics With New ...
ABC株式会社は、映像からAIに判断させてデバイスを制御する VLM(Vision Language Model)技術を活用した、自動いちご自動受粉・収穫ロボットの研究開発プロジェクトを開始しました。 本プロジェクトでは、Tenstorrent社のAIアクセラレータ「Blackhole p100a」を用いてAI ...
前回までは「gpt-oss-20b」を使ってテキストデータを用いたLLMの活用方法を解説してきた。テキストデータだけでも十分活用できるが、欲を言えば画像や動画、音声なども取り扱えるようにしたいところだろう。 そんな方に朗報だ。LM Studioではテキストデータ ...
株式会社チトセロボティクス(本社:東京都文京区、代表取締役社長:西田亮介、以下「当社」)は、生成AIを活用した産業用ロボットの動作指示システムにおいて、必要な機能を限定してAIで担うという設計思想により、精度と処理速度の両立を確認できる ...
FAニュース: 高トルクと小型化を両立、山洋電気が5相ステッピングモーターの新モデル 山洋電気は、5相ステッピングモーター「SANMOTION F」シリーズに、業界トップクラスの高トルクと小型化を両立した新モデルを追加した。半導体製造装置や搬送ロボットなどの精度向上と省スペース化に寄与する。(2026/5/21) ...