top of page

4/17 ~ 4/23の注目AIニュース








OpenAI、ワシントン・ポストと提携しChatGPTに高品質なニュースコンテンツを統合



OpenAIはワシントン・ポストと戦略的提携を結び、ChatGPTの関連質問に対して同紙の要約、引用、オリジナル記事へのリンクを表示することを発表しました。OpenAIのメディアパートナーシップ責任者バルン・シェティ氏は「週に5億人以上がChatGPTを使用しており、ワシントン・ポストのような高品質なジャーナリズムに投資することで、ユーザーが必要とする信頼性の高い情報を確実に提供できる」と述べられています。


OpenAI、API向け高品質画像生成モデル「gpt-image-1」をリリース



OpenAIが先日ChatGPTで導入した画像生成モデルを、「gpt-image-1」として開発者向けAPIで提供開始しました。ChatGPTでの画像生成は最初の1週間で7億枚以上の画像が生成され、1億3,000万人以上のユーザーに利用されるほど人気を博しています。この新モデルは、Adobe、Figma、Wixなど多くの企業がすでに採用しており、多様なスタイルの画像生成、カスタムガイドラインの忠実な反映、テキスト描画の正確さなどを特徴としています。



Microsoft、Copilot StudioにUIオートメーションのための「Computer use」機能を追加



Microsoftは、Copilot Studioにウェブサイトやデスクトップアプリケーションを自動操作できる「Computer use」機能を発表しました。この新機能により、エージェントがボタンのクリックやメニュー選択、フィールドへの入力など、グラフィカルユーザーインターフェイスを持つあらゆるシステムと対話することが可能になります。マイクロソフトによれば、この技術はリアルタイムで変化に適応し、ロボティックプロセスオートメーション(RPA)の限界を克服するとのことです。



Genspark、AIによる全自動プレゼンテーション作成ツール「AI Slides」を発表



Gensparkは2025年4月22日、プレゼンテーション作成のあり方を根本から変える新機能「Genspark AI Slides」を発表しました。このAIツールは、ユーザーがトピックを入力するだけで、関連情報の自動リサーチ、コンテンツ構成、プロフェッショナルなデザイン、適切なマルチメディア(画像、動画、音声)の挿入までをAIが実行し、完成度の高いスライドをわずか数分で生成します。自然言語によるデザイン変更や、既存のPDF、Word、Excelファイルなどを取り込んでスライド化する機能も搭載。これにより、資料作成にかかる時間と手間を大幅に削減し、誰でも質の高いプレゼンテーションを効率的に作成できるようになります。



OpenAI、o3の上位モデル「o3-pro」を数週間以内にリリース予定




OpenAIが実用的なエージェント構築ガイドを公開



OpenAIが開発者向けに「エージェント構築の実用ガイド」を発表しました。このガイドでは、大規模言語モデル(LLM)を活用した自律的なエージェントシステムの設計と実装について、実践的な知見を提供しています。エージェントは従来のソフトウェアと異なり、ユーザーに代わって高度な独立性を持って複雑なタスクを実行できる仕組みとなっています。OpenAIは顧客導入事例から得られた知見をもとに、効果的なユースケースの特定から設計パターン、安全性確保まで幅広く解説しています。



Grokが会話記憶機能を追加



Grokに会話履歴を記憶する新機能が追加されました。この機能により、ユーザーがおすすめや助言を求める際に、過去の会話内容に基づいたパーソナライズされた応答が受けられるようになります。



ByteDanceの画像生成モデルの最新版「Seedream 3.0」がGPT-4oを上回り画像生成AIのトップに



ByteDanceが開発した画像生成モデル「Seedream 3.0」が、Artificial Analysis Image Leaderboardで「一般・写真的リアリズム」カテゴリーにおいて他のモデルを大きく引き離して首位を獲得しました。このモデルは最大2048x2048ピクセルの出力に対応しており、近日中にDreamina AIのユーザーにも展開される予定です。



サイバーエージェントの広告運用、AIが社員代替




Google、「Gemini 2.5 Flash」を開発者向けにプレビュー公開



Googleは、AIモデル「Gemini 2.5 Flash」のプレビュー版をGemini APIを通じて公開しました。このモデルは優れた推論能力と高速処理を両立させ、開発者が「思考モード」のオン・オフや思考予算を設定できる業界初のハイブリッド推論モデルとなっています。思考モードをオフにしてもGemini 2.0 Flashの高速性を維持しながらパフォーマンスを向上させることができ、コストパフォーマンスにも優れています。



Gemini 2.5 Proによるポケモンプレイで5つ目のジムバッジを獲得



Google社のGemini 2.5 Proが、Anthropic社のClaude 3.7 Sonnetよりもポケモンゲームで2倍近く進行し、約1/3の行動数で達成したと報告されています。しかし、両AIは異なる「エージェントハーネス」(支援ツールや情報提供方法)を使用しているため、直接比較することはできません。GeminiPlaysPokémonの開発者自身も、これをベンチマークとして捉えるべきではないと明言しています。



OpenAI、強化学習モデルの一般公開と新画像生成APIの近日リリースを予告



OpenAIは強化学習を用いた推論モデルを一般公開する準備が整いつつあることを発表しました。また、数ヶ月以内に優れたオープンモデルをリリースする計画や、APIへの新しい画像生成機能の追加も間もなく実現するとのことです。現在APIで利用可能なo3モデルに加え、より高度な「o3-pro」モデルも開発中で近日中にリリースされる見込みとなっています。



OpenAI、30億ドル規模のWindsurf買収交渉前にCursor開発企業へのアプローチも



OpenAIは30億ドル規模でAIコーディング企業Windsurfの買収交渉を進めていますが、実はその前にCursorを開発するAnysphereにも買収の打診をしていたことが明らかになりました。2024年と今年初めに行われたAnysphereとの交渉は不調に終わり、同社は現在約100億ドルの評価額での資金調達を検討しているとされています。OpenAIにとってコード生成市場の獲得が重要課題となっており、自社開発のCodex CLIがある中でもWindsurf買収を模索する姿勢から、その戦略的重要性が伺えます。



OpenAI幹部、GoogleのChromeブラウザ買収に意欲表明



OpenAI幹部が今週のGoogle独占禁止法裁判で、GoogleのChromeブラウザが売りに出された場合、買収に関心があると発言しました。ChatGPTトップのニック・ターリー氏は火曜日の公聴会で、Chromeを取得することで「本当に素晴らしい体験を提供」し、「AI主導のブラウザがどのようなものかをユーザーに紹介できる」と述べました。OpenAIは数ヶ月前に、元Google開発者でオリジナルChromeプロジェクトに携わったベン・グッジャー氏とダリン・フィッシャー氏を雇用しており、Chromeと競合するウェブブラウザの開発を検討していると報じられています。



Microsoft Edgeの全ユーザーに「Copilot Vision」をリリース、画面上のコンテンツをAIが理解可能に



Microsoftは、画面内容を理解して支援するAIアシスタント機能「Copilot Vision」を全てのMicrosoft Edgeユーザーに公開しました。この機能を有効にすると、画面上の情報を認識し、ブラウザ利用時にリアルタイムで思考をサポートします。レビュー確認や料理中の手順説明、求人情報の解読など多様な用途に活用できます。



Anthropic、Claudeが実世界の対話で示す価値観を初めて大規模に調査



Authropicは、AI アシスタント「Claude」が数十万件の実世界対話の中でどのような価値観を示しているのかを分析しました。研究者らはプライバシーを守りながら、AI が実際の会話で示す価値観(規範的な考慮事項)を抽出し、分類しました。その結果、3,307種類の独自のAI価値観と、それらが文脈によってどう変化するかを明らかにしました。「実用性」や「認識論的価値」が全体の半分以上を占め、よく見られる価値観として「有用性」「プロフェッショナル性」「透明性」などが上位に挙げられています。また、AI の価値観は、恋愛相談では「健全な境界」を、歴史的議論では「歴史的正確さ」を、AI 倫理の議論では「人間の主体性」をより強調するなど、タスクによって大きく異なることが示されました。この研究は、AI システムの価値観を実証的に把握し、評価・設計するための基盤を提供しています。



AIモデルを悪用した影響力操作やサイバー犯罪が急増、Anthropicが最新事例を報告



AnthropicはAIモデル「Claude」の悪用事例に関する報告書を発表しました。特に注目すべきは、Claudeを使用してソーシャルメディアのボットアカウントを orchestrateし、政治的な目的で数万の本物のユーザーと交流させる「influence-as-a-service」と呼ばれる新たな形の影響力操作です。また、資格情報の不正取得、求人詐欺、マルウェア開発など、技術的知識の少ない悪意ある行為者がAIを利用して高度な攻撃能力を獲得する事例も確認されています。



パナソニック、スチームオーブンレンジ「ビストロ」向けAIサポートサービス「Bistroアシスタント」登場



パナソニック くらしアプライアンス社は、毎日の献立決めから調理中の困りごとまで、AIがLINEを通じてサポートする月額サービス「Bistroアシスタント」を2025年4月22日より開始しました。このサービスは、同社のスチームオーブンレンジ「ビストロ」の対象機種利用者に向けたものです。LINE公式アカウント上で生成AIとチャットすることで、冷蔵庫にある食材やその日の気分に応じた最適なレシピ提案を受けられます。



xAIがGrok 3ファミリーをAPIで提供開始、低コストで高性能なAIモデルを展開



xAI社が新しいAIモデル「Grok 3」シリーズをAPIで提供開始しました。特に「Grok 3 Mini」は従来の推論モデルと比較して5分の1のコストでありながら高いパフォーマンスを発揮し、STEMや数学、コーディング分野でリーダーボードの上位に位置しています。また、フラッグシップモデルの「Grok 3」は法律、金融、医療などの専門知識を要する企業向けタスクに優れており、専門家レベルの知識を提供しています。



ABEJA、LLMを用いた小型リーズニングモデル「ABEJA QwQ-32B Reasoning Model」を開発し「GPT-4o」などを上回る性能に到達



ABEJAが開発した「ABEJA QwQ-32B Reasoning Model」が、320億パラメータという小型サイズながら、OpenAIの「GPT-4o」や「o1-preview」を上回る性能を達成しました。このモデルはオフィスや工場などのエッジ環境での実装が可能で、精度とコストのトレードオフという課題を克服しています。当該モデルはHugging Faceで公開されています。



マーケターがAIに更なるコンテンツ制作と品質管理の権限を委譲



マーケティング業界では、AIエージェントによるブランドボイスの代行が進んでいます。プルデンシャル・フィナンシャルは、数百万人の顧客向けにパーソナライズされたウェブコンテンツを生成する「デジタル共同作業者」を導入しました。Opellaのような企業は医療関連のマーケティング素材を日々数百点生成するAI「工場」を運営しており、人間による規制チェックを組み込んでいますが、AIが生成した内容を修正することはせず、事実確認のみを行っています。専門家によれば、AIが開発から制作、承認まで行うマーケティングキャンペーンの到来は避けられないとされています。



ダイキンと日立製作所、生成AIで設備故障診断 対応時間半減も




アカデミー賞、AIの使用を条件付きで容認



アカデミー映画芸術科学アカデミーは、映画制作におけるAI技術の使用が賞のノミネート資格に影響しないことを正式に発表しました。しかし同時に、「人間が創作の中心にあればあるほど評価される」という方針も明確にされました。この決定は、昨年のオスカー候補作『ブルータリスト』などでAIが使用され、業界内で議論を呼んだことを背景に行われています。



裁判の流れを解説、生成AIが訴状から分析 新興が開発




Perplexity、iOS向け音声アシスタント機能を公開



PerplexityがiOSアプリに新たな音声アシスタント機能を追加したことを発表しました。この新機能は、ウェブ検索だけでなく、レストラン予約やメール送信、カレンダー登録、メディア再生など複数のアプリ連携アクションを音声で実行できます。




Comments


bottom of page