top of page

3/27 ~ 4/2の注目AIニュース



ChatGPTの画像生成機能が無料ユーザーにも開放



ChatGPTの画像生成機能が全ての無料ユーザーにも開放されました。この画像生成機能は当初から高い期待が寄せられていましたが、それを上回る予想外の需要により、無料ユーザー向けの機能提供はしばらくの間延期されていました。



xAIとXが統合、総額113億ドル規模の株式取引を完了



xAI社がX社(旧Twitter)を全株式取引で買収し、両社が正式に統合されました。この取引ではxAIの企業価値が800億ドル、Xの企業価値が330億ドル(450億ドルから120億ドルの負債を差し引いた額)と評価されています。両社の統合により、xAIの高度なAI技術とXの6億人以上のユーザー基盤を組み合わせ、よりスマートで意義のある体験を数十億人に提供することを目指しています。



Amazon、ウェブブラウザで行動するAIモデル「Nova Act」を発表



Amazonが、ウェブブラウザ内でタスクを実行できる新しいAIモデル「Amazon Nova Act」の研究プレビュー版をデベロッパー向けに公開しました。このSDKを使用することで、開発者はブラウザ内でタスクを完了できるエージェントを構築することが可能になります。Nova Actは、日付選択やドロップダウンメニューなどの一般的なUI操作において90%以上の精度を達成しており、複雑な作業を確実に実行するための基盤となることが期待されています。



Google Researchが「脳とLLMの言語処理の類似性」を発表



Googleの研究チームは、人間の脳内での言語処理と大規模言語モデル(LLM)の内部表現に線形的な一致があることを示す研究を発表しました。この研究では、自然な会話中の脳神経活動がLLMの文脈埋め込み(コンテキストエンベディング)と一致することが明らかになりました。特に興味深いのは、言語理解と発話生成の過程で、脳の特定領域の活動がLLMの音声エンベディングや言語エンベディングと時間的に関連していることです。



「Ideogram 3.0」リリース:写真レベルのリアリズムと高品質なテキスト表現を実現した次世代AIイメージ生成モデル



Ideogram 3.0が一般ユーザー向けにリリースされました。このモデルは画像と指示の一致性、写真レベルのリアリズム、テキスト表現の品質において大幅な向上を実現しており、人間による評価でImagen 3、Flux 1.1 Pro、Recraft V3、DALL·E 3を圧倒しています。スタイルリファレンス機能では最大3枚の参照画像をアップロードしてスタイルを指定でき、ブランドグラフィックやロゴ、広告など多様なデザイン用途に活用できます。



ソフトバンクG、AIロボ150兆円投資 全米で工場群計画





OpenAI画像生成ツールのジブリ風作品が著作権問題を浮き彫りに



OpenAIの最新画像生成ツールがリリースされてから24時間以内に、スタジオジブリ風のAI生成画像がソーシャルメディアで爆発的に広がっています。このツールは「となりのトトロ」や「千と千尋の神隠し」で知られる日本のアニメーションスタジオのスタイルを簡単に模倣できる機能を持っています。この現象は、AIモデルが著作権で保護された作品のスタイルをどのように学習し再現するかという法的な問題を提起しており、現在進行中の複数の訴訟の中心的な論点となっています。



OpenAIが数か月内に新たなオープンウェイトAIモデルをリリース予定



OpenAIのSam Altman氏は、同社がGPT-2以来初となる「オープンウェイト」言語モデルを今後数か月以内にリリースする計画を発表しました。このモデルは推論能力を備えており、リリース前に同社の準備フレームワークに基づく評価が行われる予定です。OpenAIは開発者からのフィードバックを集めるため、サンフランシスコを皮切りにヨーロッパやアジア太平洋地域でイベントを開催する予定とのことです。



Microsoft、業務ソフト用生成AIを自社開発へ CEO表明




Google AI Studio、開発者向け機能をアップデート — Gemini 2.5 Proの制限緩和とコード機能強化



Google が Google AI Studio に複数のアップデートを実施しました。Gemini 2.5 Pro の利用制限が 20 RPM に引き上げられ、Live モードに「Get code」機能が追加されました。また、「Open in Colab」機能がプロンプトと設定を含むようになり、「Get code」に履歴トグルとフルスクリーン表示が追加されるなど、開発者体験が向上しています。



Gemini 2.5 ProがすべてのGeminiユーザーに解放




Geminiが初代ポケモンをプレイするプロジェクトが始動。Claudeとどちらが先にクリアできるか




GeminiがGemini 2.5 ProモデルでCanvas機能提供開始



GoogleはGemini Advancedユーザー向けにGemini 2.5 ProモデルでCanvas機能の提供を開始しました。高度なコーディング能力を備えたこのモデルにより、ユーザーは簡単な指示だけで想像力豊かなプロトタイプを作成・共有することができます。



Google、夏の旅行計画に役立つ5つの新機能を発表



Googleは、夏の旅行シーズンに向けて検索、マップ、Lens、Geminiの新機能を発表しました。AIオーバービューを使った国単位の旅程作成、ホテル価格の追跡通知、スクリーンショットから行き先リストを自動作成する機能などが追加されます。これらの機能は順次グローバルに展開され、ユーザーの旅行計画から現地での観光まで、より便利なサポートを提供します。



OpenAIがChatGPTやAPIをMCPに対応する方針




OpenAI、25年売上高3倍1.9兆円に サブスクで成長加速




ChatGPTのGPT-4oがアップデート。様々な性能が向上



OpenAIのChatGPTに搭載されているGPT-4oが新たなアップデートを受け、機能が強化されました。このアップデートでは、複数のリクエストを含む詳細な指示への対応力が向上し、複雑な技術的問題やコーディングの課題に対する能力も改善されています。現在は有料ユーザーのみが利用可能ですが、無料ユーザーも数週間以内に利用できるようになる予定です。



OpenAIの担当者がGPT-4oで寛容になった画像生成のポリシーについて詳細な解説



OpenAIが新たな画像生成機能をChatGPTに実装しました。同社の担当者によると、これまでの一律的な制限から、実際の害を防ぐことに焦点を当てたより精密なアプローチへと方針を転換しています。このアップデートでは、AIラボの従業員ではなくユーザー自身が創造できるものを決めるべきという考えのもと、公人の扱いについては描写される人物が自ら選択できるオプトアウト制度を導入しました。「攻撃的」なコンテンツに関しては、個人的意見や好みと実際の害の可能性を区別する努力をしており、ヘイトシンボルについては教育的・文化的文脈での使用を認めつつ有害な誤用を防ぐ技術的手法を開発中です。未成年者に関わる政策決定では、研究と製品全体で若年ユーザーに対してより強力な保護と厳格なガードレールを選択する慎重な姿勢を維持しています。



ChatGPT、Google Driveと連携してチーム内の知識へのアクセスを提供



ChatGPTが、Google Driveワークスペース全体の連携機能をベータ版として提供開始しました。この新機能により、ChatGPT Teamのユーザーは組織のGoogle Driveワークスペースに接続し、リアルタイムで内部知識を活用した回答を得ることができます。さらに、モデルは組織固有の用語やプロジェクト名、チーム特有の言葉を学習しながら、ユーザー権限を尊重したコンテキストに基づいた応答を提供します。



OpenAIのAltman氏、爆発的な画像生成需要に対応するチームの疲弊を訴える



OpenAIのCEO、Sam Altman氏が画像生成需要の爆発的な増加により、チームが睡眠不足に陥っていることを明かしました。発表によると、サービス開始以来「追いつくことができていない」状態が続いており、「聖書的な需要」と表現するほどの前例のない利用状況に直面しています。アルトマン氏は利用者に対して落ち着いた利用を呼びかけています。



OpenAI、300億ドルの企業評価額で40億ドルの資金調達



OpenAIは300億ドルの企業評価額で40億ドルの新規資金調達を発表しました。この資金はAI研究の最前線をさらに押し広げ、コンピューティングインフラを拡大し、毎週5億人が使用するChatGPTをより強力なツールへと進化させるために活用されます。ソフトバンクグループとのパートナーシップを通じて、科学的発見の促進や個別化された教育の実現、人間の創造性の向上など、人類全体に利益をもたらすAGI(汎用人工知能)の開発を目指していくとのことです。



「日経平均の企業85%がCopilot利用」――来日したMicrosoftのナデラCEO、日本でのAI展開を語る




MicrosoftがCopilot Studioに深層推論とエージェントフローの新機能を追加



Microsoftは、Copilot Studioに「Deep Reasoning」と「Agent Flows」という2つの新機能を追加すると発表しました。Deep ReasoningはOpenAI o1などの高度な推論モデルを活用し、複雑なタスクや詳細な分析を必要とする業務をエージェントが処理できるようにする機能です。一方、Agent Flowsは予め定義された手順に従って一貫した結果を提供するAIワークフローを実現します。これらの機能により、企業データと高度な推論モデル、ワークフローを組み合わせた幅広いエージェント作成が可能になります。



MicrosoftのCopilot StudioがMCPに対応




Microsoft、AIモデル「DeepSeek R1」を新たな成功基準に



MicrosoftのCEOサティア・ナデラ氏は、新たに導入されたAIモデル「DeepSeek R1」が同社のAIイニシアチブにおける新たな成功基準を設定したと強調しました。同モデルは、事前学習モデルと低レベルの最適化作業から得られた効率性を備えています。Microsoftは、アプリケーション群にAI主導の機能を統合することを目指しています。



日本航空、新AIアプリで客室乗務員の機内業務報告を効率化 ー Microsoftの小規模言語モデルPhi-4を活用



日本航空(JAL)が、Microsoft社の小規模言語モデルPhi-4を活用した新AIアプリ「JAL-AI Report」を開発し、客室乗務員の機内業務報告を効率化することに成功しました。このアプリは、これまで最大1時間かかっていた業務引き継ぎレポートの作成時間を約20分に短縮でき、機内Wi-Fi環境が不安定な状況でもオフラインで動作する特徴を持っています。JALはこの取り組みにより、客室乗務員が事務作業時間を削減し、お客様対応により多くの時間を割けるようになることを目指しています。



Claude開発者が大規模言語モデルの「思考過程」を可視化



Anthropic社の研究チームが、大規模言語モデル「Claude」の内部で行われている思考過程を可視化する新しい手法を開発したことが発表されました。研究では、モデルが複数の言語間で共通の「思考言語」を持つこと、詩の韻を数語先まで計画していること、また時に論理的思考ではなく納得させるための説明を作り出していることなどが明らかになりました。この技術は、AIの透明性を高め、より信頼性の高いシステム開発に貢献することが期待されています。



Alibabaが「Qwen2.5 Omni」を発表。テキスト、画像、音声、動画などの多様な入力を処理し、テキスト生成と音声合成が可能



Alibabaは、テキスト、画像、音声、動画などの多様な入力を処理し、リアルタイムでテキスト生成と音声合成が可能な新しいフラッグシップモデル「Qwen2.5-Omni」を発表しました。同モデルは「Thinker-Talker」と呼ばれる新しいアーキテクチャを採用し、単一モダリティの同サイズモデルと比較しても優れたパフォーマンスを示しています。HuggingFace、ModelScope、GitHub等で公開され、今後は音声コマンド対応と視聴覚理解能力の向上を目指すとのことです。



DeepSeekが最新モデル「DeepSeek V3.1」を発表



DeepSeekは、強化された推論能力と100言語以上の多言語サポートを特徴とする最新のAIモデル「DeepSeek V3.1」をリリースしました。560億のパラメータと100万トークンのコンテキストウィンドウを備え、前モデルと比較して推論能力が43%向上し、ハルシネーションも38%減少しています。このモデルはすでにエンタープライズ顧客向けに提供が開始され、今後2週間でChrome拡張機能ユーザーにも段階的に展開される予定です。



Manusがモバイルアプリをリリース。有料プランも同時に発表




AI時代は「思考力」が武器に―Replit CEO、プログラミング学習より重要なスキルを提唱


Replit CEOのAmjad Masadは、AIの進化に伴い、単にコーディング技術を習得することの重要性は相対的に低下すると指摘しました。同氏は、「コーディングを学ぶ代わりに、思考法、問題分解能力、そして(人間やAIに対して)明確にコミュニケーションする能力を学ぶべきだ」と強調。これらの普遍的なスキルこそが、AIを活用してアイデアを実現する上で今後ますます重要になるとの見解を示しました。




ビル・ゲイツが「10年以内にAIが多くの医師や教師に取って代わる」と発言



ビル・ゲイツ氏は、今後10年間でAI技術の進歩により、多くの専門職が自動化され、人間が「ほとんどのことに必要とされなくなる」と予測しています。現在は「優れた医師」や「優れた教師」などの専門知識は「希少」ですが、AIによって「優れた医療アドバイス、優れた家庭教師」が「無料で一般的に」なると述べています。一方で、野球のような特定の活動は人間のために残されるだろうとも付け加えています。



サム・アルトマンのOpenAI解任の秘密と誤解:最注目テック企業CEOの追放と電撃復活の内幕




Appleマップの写真をAI学習に活用



Appleが、2025年3月からApple Mapsの「Look Around」機能で収集した画像データをAIモデルのトレーニングに活用することを発表しました。このデータは顔やナンバープレートにぼかし処理を施した上で、画像認識や生成、強化に関連するモデルの学習に使用されるとのことです。Apple Intelligenceの複数の機能がこの取り組みによって強化される可能性があります。



Runwayが最新動画生成AI「Runway Gen-4」を発表



Runway社は新たな画像・動画生成AIモデル「Gen-4」を発表しました。このモデルは従来のGen-3 Alphaから大幅に進化し、動的な動きのリアリズムや被写体・スタイルの一貫性において優れた性能を発揮します。すでに有料プランおよび企業顧客向けに「Gen-4 Image-to-Video」機能の提供が開始されています。



Luma AIが「Ray2 Camera Motion Concepts」を発表



Luma AIは、新たに開発した「Ray2 Camera Motion Concepts」をDream Machineに実装したことを発表しました。このアップデートでは、滑らかな映画的制御と高い信頼性を持つ20以上の精密調整されたカメラモーションが提供されています。これらのコンセプトは相互に組み合わせることができ、これまで不可能だった数百の新しいカメラ動作を実現することが可能になりました。



描くだけで3Dモデルが作れる新ツール「Vibe Draw」が登場




マネーフォワード、バックオフィス業務にAIエージェント導入へ



マネーフォワードはAI戦略「Money Forward AI Vision 2025」を発表し、バックオフィス業務を自律的に支援する「AIエージェント」の提供を開始することを明らかにしました。同社は経費・会計・HR領域などで活用可能なAIエージェントや、外部サービスとの連携を可能にする「AIエージェントプラットフォーム」、企業のAI活用を支援する「AXコンサルティング」を2025年中に順次提供する予定です。



2025年生成AI支出は76%増の6440億ドルへ、ガートナー予測



調査会社ガートナーは、2025年の世界の生成AI支出が前年比76.4%増の6438億6000万ドル(約6440億ドル)に達すると予測しました。サービス、ソフト、デバイス、サーバー全てで増加し、特に支出の8割はAI搭載サーバーやスマホ、PC等のハードウェア向けとなる見込み。2028年までにほぼ全ての消費者向けデバイスがAI対応になるとも予測しています。また、2025年には企業がビジネス価値を重視し、自社開発から既存の生成AIソリューション利用へシフトすると指摘しています。



生成AIの歌詞無断学習めぐる訴訟、米地裁がレコード会社の仮差し止め請求を却下



米ユニバーサル等のレコード会社が、AI企業アンソロピックによる歌詞の無断学習差し止めを求めた訴訟で、米連邦地裁は仮差し止めの訴えを退けました。生成AI「クロード」によるテイラー・スウィフト等の歌詞学習に対し、原告は回復不能な損害を主張しましたが、地裁は立証不十分と判断。AIによる著作物利用が著作権侵害にあたるかの本案判断は持ち越されました。AI開発における著作権とフェアユースの議論は続いています。



カカクコム、全エンジニア500人にAIエディタ「Cursor」導入



カカクコムは、開発体制強化とサービス品質向上を目的に、全エンジニア約500人にAIコードエディタ「Cursor」を導入しました。Cursorはコード自動生成やデバッグ支援機能を備え、実装時間短縮や品質向上を目指します。開発業務だけでなく、タスク管理や文書作成など業務全体の生産性向上、エンジニアの創造性最大化、AIネイティブな組織文化醸成も狙います。今後、デザイナー等への導入も検討し、全社的なAI活用を進める方針です。



Gensparkが新しいAIエージェント「Super Agent」を発表



Gensparkが革新的なAIアシスタント「Super Agent」を発表しました。このAIは自律的に思考・計画・行動し、様々なツールを自動的に活用することで日常タスクを処理できる汎用AIです。旅行予約から動画変換、データ分析まで幅広い業務に対応し、高速かつ信頼性の高い結果を提供する点が特徴となっています。



NotebookLMに新機能「Discover sources」が登場、ウェブから関連情報を簡単に収集可能に



NotebookLMに「Discover sources」という新機能が追加され、ユーザーが調べたいトピックに関連する情報をウェブから簡単に収集できるようになりました。この機能を使用すると、トピックを入力するだけで、NotebookLMが関連性の高いウェブソースを自動的に分析・選定し、ワンクリックでノートブックに追加することができます。また、初心者向けに「I'm Feeling Curious」ボタンも導入され、ランダムなトピックに関するソースを生成する機能も搭載されています。



GPT-4.5がチューリングテストに合格



数種類の大規模言語モデルに対するチューリングテストの研究が行われました。GPT-4.5は人間のペルソナを採用するよう指示された場合、会話相手が人間だと判断される割合が73%に達し、実際の人間参加者よりも高い評価を得ました。LLaMa-3.1-405Bも同様の指示で56%の評価を獲得し、人間との区別がつかないレベルに達しています。これは人工システムが標準的な三者間チューリングテストに合格した初めての実証的証拠となっています。



コードベースを深く理解し成長するAIペアプログラマー 「Argument Agent」が登場



Argument Code社が、10万ファイル以上の大規模コードベースにも対応する新サービス「Argument Agent」を発表しました。このAIエージェントはSWE-bench-verifiedベンチマークで1位を獲得した技術を活用し、最大20万トークンのコンテキスト容量を持ち、作業中に自動的に更新される「Memories」機能でコードスタイルに適応しながら継続的に改善します。コードチェックポイント機能やマルチモーダル対応、ターミナルコマンド実行など実用的な機能を搭載し、VS CodeとJetBrainsで利用可能です。GitHub、Jira、Confluence、Notion、Linearなどの統合ツールにも対応しており、14日間の無料トライアルで今すぐお試しいただけます。

コメント


bottom of page