3/13 ~ 3/18の注目AIニュース
- Holidayスタッフ
- 3月19日
- 読了時間: 10分
更新日:3月31日

Google DeepMindがロボット用の最新AIモデル「Gemini Robotics」を発表
Google DeepMindが、Gemini 2.0を基盤としたGemini RoboticsとGemini Robotics-ERを発表しました。これらのAIモデルは、ロボットが現実世界を理解し、安全に行動するための基盤となり、Apptronikとの提携でヒューマノイドロボット開発も進んでいます。
Geminiが新機能を多数追加。Deep Researchが性能強化し無料でも使えるように
GoogleはGeminiに「Deep Research」や「Gems」などの機能を強化し、世界中のユーザーに提供開始したことを発表しました。Deep Researchは2.0 Flash Thinking Experimentalモデルを採用し、検索から分析、レポート作成までの研究プロセスを強化、リアルタイムで思考過程を表示する機能も追加されています。さらに他の新機能として、Googleアプリと連携したパーソナライズ機能、カレンダーやメモなどの連携アプリの強化、AIをカスタマイズできる「Gems」機能の一般提供も開始されました。
Gemini 2.0 Flash Experimentalでテキスト指示での画像生成・編集が可能に
Gemini 2.0 Flashで、テキストから画像を生成する実験が始まりました。ストーリーに合わせたイラスト作成や、会話形式での画像編集が可能です。APIを通して、すぐに利用できます。
Geminiがパーソナライズ機能を追加
Geminiが新たに「パーソナライゼーション機能」を実装。Google検索履歴を活用し、ユーザーの興味に即した提案が可能に。プライバシー制御も簡単に行えます。
Google AI StudioでYouTubeリンクからの動画読み込みをサポート
Google AI StudioがYouTube動画リンクのサポートを新たに開始しました。YouTube動画のURLを貼り付けるだけで、Geminiの動画理解機能を活用できるようになります。この新機能により、追加の処理なしで動画コンテンツの分析や理解が可能になります。
Google Meetで会話内容をAIで要約する機能が日本語対応
Google Meetのノート自動作成機能「Take notes for me」が、日本語を含む7つの言語で新たに利用可能になりました。この機能を有効にすると、会議でのメモ取りが自動化され、参加者全員が青い鉛筆アイコンを通じてリアルタイムでノートを確認できるようになります。本機能はGoogle Workspace Business StandardとPlus、Enterprise StandardとPlus、およびGemini Education Premiumアドオンを契約しているユーザーが利用できます。
Googleアシスタント、2025年内に「Gemini」に完全移行へ
Googleは2025年内にAIアシスタント「Googleアシスタント」を「Gemini」に置き換えると発表しました。スマートフォンやタブレットを含む多くのデバイスが対象で、年内にはアシスタントはアプリストアからもダウンロード不可となります。
OpenAI、「o1」と「o3-mini」にPythonベースのデータ分析機能を追加
OpenAIは推論系モデルのo1とo3-miniにおいて、ChatGPT上でPythonを活用したデータ分析機能の提供を開始しました。この新機能により、ユーザーはテストデータの回帰分析の実行、複雑なビジネスメトリクスの可視化、シナリオベースのシミュレーションなどのタスクをChatGPT上で直接実行できるようになります。推論系モデルでデータ分析できるようになることで、ChatGPTでのデータ分析性能が大幅に向上しています。
OpenAIのCPOがコーディングの自動化は2026年までに実現と発言
OpenAIの最高製品責任者Kevin Weilは、プログラミングのAI自動化について「Anthropicが2027年と予測するよりも大幅に早く、今年か来年には実現するだろう」と発言しました。Weilによれば、同社の「o1」モデルは競技プログラミングで世界100万位、後継の「o3」モデルは175位相当の能力を持ち、次期モデルではさらに向上するとのことです。「今年はAIがプログラミングで人間より永遠に優れる年になる」と述べ、これによりソフトウェア開発の民主化が進み、技術的知識がなくても誰もがアプリケーションを作成できるようになると予測しています。
OpenAI、ChatGPT TeamでGoogle Drive・Slack連携のベータテストを開始
OpenAIが、ビジネスユーザー向けにGoogle DriveやSlackをChatGPTと連携させる新機能「ChatGPT Connectors」のベータテストを開始する計画を明らかにしました。この機能はChatGPT Teamのユーザーがワークスペースのファイル、プレゼンテーション、スプレッドシート、Slack会話に基づいた質問に回答できるようにするもので、GPT-4oモデルの特別バージョンが企業の内部知識に基づいて回答を調整します。プライバシー面では権限を完全に尊重し、管理者が同期するSlackチャンネルやGoogle Driveファイルを選択できるようになっています。
OpenAI、中国勢の台頭受けトランプ政権に行動促す
OpenAIは、トランプ政権に対し、米国のAI競争力維持に向けた提言を公表しました。中国企業ディープシークの台頭により、米国の優位が縮まっていると警鐘を鳴らし、技術革新促進を求めています。
ChatGPT利用者の大半は大学生、日本でも18〜24歳が最多に
OpenAI Japanは、世界中で4億人が利用するChatGPTの大半が35歳以下であり、日本では特に18〜24歳の大学生が多いと発表しました。教育機関向け「ChatGPT Edu」の導入事例や、AI活用の課題にも注目が集まっています。
Apple、AirPodsにリアルタイム翻訳機能追加へ - 年内ソフト改良で実装予定
アップルはAirPodsに、対面会話を即時に別言語へ翻訳する機能を導入予定でであると事情に詳しい複数の関係者が明らかにしました。次期OS「iOS 19」と連動し、年内にソフト改良として提供される可能性があるようです。
AppleのSiri責任者、「AIの遅れは醜く、恥ずかしい」と発言し、改善を約束
AppleのSiri担当上級ディレクターが社内会議で、「Apple Intelligence」の一環として進めていたSiri近代化計画の大幅な遅延について「醜く、恥ずかしい」と表現し、開発チーム内に「怒り、失望、燃え尽き」が広がっていることを認めました。当初今年春に予定されていた機能は来年以降へ先送りとなり、現状では機能が正常に動作する確率は66〜80%程度にとどまっています。Appleは「世界最高のバーチャルアシスタント」実現に向けて2027年までの大規模インフラ刷新を計画していますが、品質を重視して完成度の高い状態での提供を優先する方針です。
ソフトバンク、大規模AIデータセンター建設へ。シャープ堺工場を約1,000億円で取得
ソフトバンクは、大規模AIデータセンター建設のため、大阪府堺市にあるシャープの堺工場の土地・建物を約1,000億円で取得しました。2026年の稼働を目指し、生成AIや各種AI関連事業に活用する予定です。
SB Intuitionsが日本語特化のVLM「Sarashina2-Vision」を公開
SB Intuitionsは日本語や日本文化に特化した大規模視覚言語モデル「Sarashina2-Vision」(8Bと14Bの2種類)を公開しました。このモデルは同社の日本語LLM「Sarashina2」をベースに開発され、複数の日本語ベンチマークで国内最高性能を達成しています。特徴として日本語文字認識やグラフ・図表理解などの能力に優れており、Qwen2-VLのViTを画像エンコーダとして採用することで高解像度画像の処理も可能です。
AIがおすすめゲームや攻略をサポート、「Copilot for Gaming」登場。
MicrosoftはAIアシスタント「Copilot for Gaming」を発表しました。プレイヤーのプレイスタイルに応じたアドバイスやゲームの準備をサポートし、仲間やコミュニティーとのつながりも強化します。4月にモバイル版が提供開始予定です。
Perplexity APIのMCPが公開 – ClaudeがリアルタイムWeb検索対応に
Perplexity APIがModel Context Protocol (MCP)を正式に公開しました。同社はAIアシスタント向けにリアルタイムウェブ検索機能を提供する「Sonar」用のMCPサーバーを構築しました。これにより、ClaudeなどのAIアシスタントがPerplexityの技術を活用してウェブ検索を行い、リアルタイムで正確な情報を提供できるようになります。
Anthropic、Claude 3.7 SonnetのAPIにトークン節約機能を追加
Anthropicは、Claude 3.7 Sonnetを使用する開発者のスループット向上とトークン使用量削減を可能にするAPI更新を発表しました。キャッシュを考慮したレート制限、簡素化されたプロンプトキャッシング、トークン効率の良いツール使用が導入されています。これらの更新により、既存のレート制限内でより多くのリクエストを処理し、コードの変更を最小限に抑えながらコストを削減できるようになります。
Figureが新たなヒューマノイドロボットの大量生産施設「BotQ」を発表
Figureは、年間12,000台のヒューマノイドロボットを製造可能な高量産施設「BotQ」の立ち上げを発表しました。同社は製造プロセスと品質管理のため生産を内製化し、独自のFigure 03ロボットは高速量産向けに再設計されています。特筆すべき点として、Figureの自社ヒューマノイドロボットが生産ライン上で他のロボットを組み立てる「ロボットがロボットを作る」製造アプローチを今年中に開始する計画も明らかにしました。
Jizai、「カスタマイズできる汎用AIロボット”Mi-Mo(ミーモ)”」の仕様を公開、併せてサービスサイトも開設
株式会社Jizaiは、カスタマイズ可能な汎用AIロボット「Mi-Mo(ミーモ)」の仕様を公開し、サービスサイトを開設したことを発表しました。初期モデル「Mi-Mo v0」は視覚・音声・動作を統合した自律型AIロボットで、木材を使用した温かみのあるデザインが特徴です。複数のAIモデルを連携させた拡張性の高いソフトウェア構成となっており、ユーザー自身によるアプリケーション開発やハードウェアのカスタマイズも可能となっています。エンターテイメントや小売・飲食業、医療介護など、対話と移動機能を必要とする幅広い分野での活用を想定しています。
Baiduが新AIモデル「ERNIE 4.5」と「ERNIE X1」を発表。ERNIE X1はDeepSeek R1と同等の性能を半額で提供
Baiduが新AIモデル「ERNIE 4.5」と初の推論モデル「ERNIE X1」を発表しました。ERNIE 4.5はOpenAIのGPT-4.5と同等以上の性能を持ちながら、APIの価格は入力1000トークンあたり0.08円からと大幅な低価格化を実現しています。ERNIE X1はDeepSeek R1と同等の性能を持つ推論特化型モデルで、入力価格は1000トークンあたり0.04円からという破格の料金設定となっています。両モデルは個人ユーザー向けにチャットサービス「ERNIE Bot」で無料提供が開始されました。
Mistral AI、GPT-4o Miniを上回る新しいオープンソースモデルを発表
Mistral AIは、マルチモーダル・多言語対応の新モデル「Mistral Small 3.1」を発表しました。24Bパラメータのこの新モデルは、テキスト性能の向上、画像理解能力の追加、最大12.8万トークンのコンテキストウィンドウを特徴とし、同クラスのGemma 3やGPT-4o Miniを上回る性能と秒間150トークンの推論速度を実現しています。単一のRTX 4090や32GB RAMのMacでも動作する軽量設計で、企業向けおよび消費者向けAIアプリケーションに適しています。
AIがコードを書く時代だからこそプログラミングを学ぶべき理由
AIの発展によりプログラミング職が消滅するという懸念から学習を避ける風潮に対し、専門家は強く反論しています。パンチカードからキーボード、アセンブリ言語から高水準言語、そしてAIアシスト開発へと進化する中、コーディングはむしろ身につけるべき重要スキルだと指摘されています。専門家によれば、AIツールを効果的に活用するにはコーディングの知識が不可欠であり、自分の専門分野の言語とプログラミングの言語の両方を理解することで、AIに正確に指示を出せるようになるとのことです。
Vibe Codingがもたらす、誰もが自分専用アプリを自然言語で作れるコンシューマーAIの未来
AIによるコーディングの変化と、それによって生まれる新たな可能性について議論されています。AIコーディングエージェントに自然言語で指示を出し、フィードバックを与えるだけでWebサイトやアプリが作れる「Vibe Coding」は、技術者・非技術者を問わず、様々な人が独自のツールを構築できる時代が到来することを示唆しています。この動きは、消費者向けアプリだけでなく、企業の生産性向上ツールにも広がり、今後はより多くの人がAIを活用して「自分専用ソフトウェア」を作る世界が期待されます。
Webサイトの完全なコピーサイトを作ることができる「Same.dev」が登場
あらゆるWebサイトをピクセル単位の精度で複製できるサービス「Same.dev」が登場しました。複製したいWebサイトのURLを貼り付けるだけで、全く同じ見た目のWebサイトを作成することが可能です。
世界初、100%AI生成の論文が査読通過 「AIサイエンティスト」が達成
Sakana AIの「AI Scientist-v2」が生成した論文が、トップレベルの機械学習国際学会ICLRのワークショップで査読プロセスを通過しました。この論文は人間の介入なく完全にAIによって生成され、査読者の平均スコア6.33を獲得し、提出された全論文の約45%を上回る評価を得ています。ブリティッシュコロンビア大学とオックスフォード大学の研究チームとの協力のもと実施されたこの実験は、AIが科学研究の領域で新たな可能性を示す重要な一歩となりました。