5/1 ~ 5/7の注目AIニュース
- Holidayスタッフ
- 5月8日
- 読了時間: 10分

Microsoft、Phi-4-reasoningモデル群を発表:小型言語モデルの新時代を切り拓く
https://azure.microsoft.com/en-us/blog/one-year-of-phi-small-language-models-making-big-leaps-in-ai/
Microsoftは、小型言語モデル(SLM)の新シリーズとして「Phi-4-reasoning」「Phi-4-reasoning-plus」「Phi-4-mini-reasoning」の3つの推論特化モデルを発表しました。これらのモデルは、小型ながら複雑な数学的推論やPh.D.レベルの科学的問題に対して、はるかに大きなモデルと同等以上の性能を発揮することが特徴です。特に14億パラメータの「Phi-4-reasoning」は、671億パラメータの「DeepSeek-R1」モデルと比較しても優れた性能を示し、リソースが限られた環境でも効率的に複雑な推論タスクを実行できるようになっています。
デジタル庁が生成AIガイドライン、機密情報も学習可能に
Pinterestが生成AI表示ラベルを導入:透明性向上への新たな一歩
Pinterestは、AIで生成または修正された画像に「AI modified(AIで修正)」というラベルをグローバルに表示する機能を導入しました。このラベル表示はメタデータ分析だけでなく、自動的に生成AIコンテンツを検出する分類器も活用しており、今後さらに精度が向上する見込みです。また、ユーザーがAI生成コンテンツを「表示を減らす」オプションを選択できる実験も近日開始し、特に美容やアートなどのカテゴリーにおけるAI生成コンテンツの表示をコントロールできるようになります。
ウィキメディア財団、編集者支援のためのAI戦略を発表
ウィキメディア財団は2025年4月、エディター(編集者)を支援するための3年間のAI戦略を発表しました。この戦略では、コンテンツの信頼性確保、新規編集者の育成、多言語展開の強化、そして人間を中心としたAI活用に焦点を当てています。AIを活用することで編集者の単調な作業を自動化し、人間の判断や議論、地域的視点の共有により多くの時間を割けるようにすることを目指しています。
Anthropic API に「Web Search」ツールを導入——開発者が最新情報を組み込んだエージェントを構築可能に
Sunoが音楽生成モデル「v4.5」を発表、より表現力豊かな音楽制作が可能に
Sunoは最新の音楽生成モデル「v4.5」をリリースしました。新モデルでは、より表現力豊かな音楽、ジャンルの多様性と正確性の向上、そして豊かなボーカル表現が実現されています。ユーザーは直感的な操作で創作活動ができるようになり、詳細な説明からの曲作成や、カバー曲とペルソナ機能の組み合わせなど、新たな創作ツールも提供されています。
VisaがAIエージェントにクレジットカード情報を提供する計画を発表
VisaはAIエージェントがユーザーに代わって買い物ができるよう、AIチャットボット開発企業と提携することを発表しました。AnthropicやMicrosoft、OpenAIなど主要AI企業と連携し、ユーザーが予算と好みを設定すれば、AIが自動的に商品を検索・購入できるシステムを構築します。Visaの最高製品戦略責任者は「これはeコマースの出現と同等の変革をもたらす可能性がある」と述べています。
GoogleアプリにAI機能「Simplify」登場、iOS版で複雑なウェブテキストを簡略化
Google iOS向けアプリに新機能「Simplify」が追加され、ウェブ上の難解なテキストをAIで簡単に理解できるようになりました。ユーザーは選択したテキスト部分を「Simplify」アイコンをタップするだけで、ページを離れることなく簡略化された内容を確認できます。この機能はGoogle Researchが開発した新しいプロンプト洗練アプローチを特徴とし、Geminiを活用して重要な詳細を失うことなく複雑なテキストを理解しやすくしています。
Google、検索キャンペーン向け「AI Max」を発表:AIを活用した広告パフォーマンス強化
Googleは検索広告キャンペーン向けの新機能「AI Max」を発表しました。この機能はGoogleのAI技術を活用し、ターゲティングとクリエイティブを強化することで、広告パフォーマンスを向上させます。同社によると、AI Maxを活用した広告主は通常14%多くのコンバージョンや同等のCPA/ROASでコンバージョン価値を獲得でき、今月後半からグローバルでベータ版の提供が開始される予定です。
OpenAI、組織再編を発表:非営利団体による統括を維持し、営利部門を公益法人(PBC)へ移行
OpenAIは組織構造の変更計画を発表しました。中核は、設立母体の非営利団体が引き続き組織全体を監督・管理し、傘下の営利LLCを公益法人(Public Benefit Corporation - PBC)へと移行させる点です。このPBCは、株主の利益とOpenAIの「人工汎用知能(AGI)が全人類に利益をもたらすようにする」という使命の両方を考慮します。この変更後も使命は不変であり、非営利団体はPBCを管理するとともに大株主となり、得られたリソースで公益活動を拡大します。サム・アルトマンCEOは、AGIを全人類に力を与えるツールとし、民主的なAIの実現、広範なツール提供への期待を表明。現行の複雑な上限利益構造からシンプルな資本構造への移行であり、売却ではなく構造の簡素化だと説明しています。この決定は、市民リーダーや州司法長官事務所との対話を踏まえたものです。
Anthropic「AI for Science Program」を開始
Anthropicは、APIへのアクセスを通じて科学研究と発見を加速させることを目的とした新しいイニシアチブ「Anthropicの科学向けAIプログラム」を開始します。このプログラムは、影響力の大きい科学プロジェクトに取り組む研究者を支援するために無料のAPIクレジットを提供し、特に生物学および生命科学の応用分野に焦点を当てています。
Google 検索「AI Mode」一般公開 & 新UXを追加
Microsoft、企業向け「エージェンティックAI」活用事例を公開
マイクロソフトは、「エージェンティックAI」が顧客のAIファーストなビジネス変革を推進すると強調しています。自律的に動作するAIエージェント、Copilot、人間の期待を組み合わせることで、差別化されたAI価値を提供。Microsoft 365 Copilot ChatやCopilot Studio等のツールを通じ、多くの企業が業務自動化による生産性向上、コスト削減、従業員体験向上などを実現しています。同社はAIで知能を民主化し人間の成果を支援、今後も顧客とAIの可能性を追求し、実践的なイノベーションを推進します。
OpenAIがWindsufrf買収合意、約4300億円で-関係者
Salesforce「Agentforce for HR Service」をリリース
Google DeepMind「Gemini 2.5 Pro」アップデート——1プロンプトで動くWebアプリ生成が強化
Anthropic、Claude に外部ツールを接続できる「Integrations」+高度 Research モードを追加
OpenAI、「OpenAI for Countries」構想を発表
Google、自社生成AIをiPhoneに搭載 年内合意へ協議
AWSがAmazon Nova Premierを一般公開:複雑なタスク処理とモデル蒸留に特化した最高性能モデル
Amazon Nova Premierは、テキスト、画像、動画を処理し、100万トークンのコンテキスト長を持つAWSの最も高性能なAIモデルとして一般提供が開始されました。このモデルは複雑なタスクの深い理解と多段階の計画立案、複数のツールやデータソースにわたる正確な実行に優れており、同じ知能層の他のモデルと比較して約半数のベンチマークで同等または優れたパフォーマンスを示しています。また、Nova Premierは「教師モデル」として、その高度な能力を特定のユースケース向けに小型で高速かつ効率的なNova Pro、Micro、Liteモデルへ転送することができ、本番環境向けの最適化が可能です。
シュミット元Google会長支援のFutureHouse、科学研究を加速する4種のAIツールを発表
元Google会長エリック・シュミット氏が支援する非営利団体のFutureHouseは、科学研究支援のための4つのAIツール「Crow」「Falcon」「Owl」「Phoenix」を発表しました。これらのツールは科学論文の検索や分析、化学実験の計画立案などを支援するもので、一般的なAIと異なり高品質な科学論文データベースと専門的な科学ツールにアクセスできます。
Microsoft CEOが「社内コードの最大30%がAIによって書かれている」と発言
Microsoftのサティア・ナデラCEOは、MetaのLlamaCon会議でマーク・ザッカーバーグCEOとの対談中に、同社のリポジトリ内のコードの20〜30%が「ソフトウェア(AI)によって書かれた」と明かしました。ナデラCEOによると、AI生成コードの成果は言語によって異なり、Pythonでは進展が見られる一方、C++ではそれほど進んでいないとのことです。一方、GoogleのピチャイCEOは先週の決算説明会で、同社のコードの30%以上がAIによって生成されていると述べています。
AI研究機関Ai2が小型モデル「OLMo 2 1B」を発表
Ai2がOLMoモデルファミリーの最小サイズとなる「OLMo 2 1B」を発表しました。このモデルは同サイズのGemma 3 1BやLlama 3.2 1Bを上回る性能を持ち、研究者の迅速な反復開発や、よりローカルな環境での開発を可能にします。4兆トークンの高品質データでトレーニングされ、Tülu 3レシピに従った指示チューニングと強力なモデルからの蒸留、検証可能な報酬による強化学習(RLVR)を実施しています。
OpenAIがGPT-4oの「媚びる」問題を詳細に解説、改善策を発表
OpenAIは4月25日にリリースしたGPT-4oのアップデートで発生した「媚び」の問題について詳細な説明を公開しました。このアップデートではモデルがユーザーに過度に同意したり、感情を増幅させたりする傾向が見られました。OpenAIは問題の発見後すぐにロールバックを実施し、今後はモデルの行動評価をより重視し、アルファテスト段階の導入など、評価プロセスを改善すると発表しています。
LV5日野社長「ゲームプログラムの8〜9割はすでにAIが作る」、若手クリエイターに「審美眼」の重要性を説く
CESAが主催する若手ゲームクリエイター育成プログラム「トップゲームクリエイターズ・アカデミー(TGCA)」の入学式で、レベルファイブの日野晃博社長はAI時代のクリエイターに必要なのは「審美眼」であると強調し、「よいものと悪いものを見分け、ディレクター的視点で優れたものを選ぶ目が必要」とメッセージを送りました。
X社の推薦アルゴリズムがGrokの軽量版に置き換えられる
Xの推薦アルゴリズムが、Grokの軽量版に置き換えられることが発表されました。この変更により、推薦システムは「劇的に改善される」とされており、すでに一部の改善が見られ始めているとのことです。
司法判断にAI関与「あり得ない話ではない」 最高裁長官が会見
NotebookLM が Gemini 2.5 Flash を搭載
NotebookLM が公式に Gemini 2.5 Flash を搭載したことが発表されました。この 2.5 モデルは「思考モデル」として機能し、特に複雑な多段階推論を必要とする質問に対して、より包括的な回答を提供できるようになっています。
Apple、Anthropicと協力してVibe Codingプラットフォームを開発
AppleがClaudeを開発するAnthropicとの提携により、新しいAI駆動型のVibe Codingプラットフォームを開発し、社内の従業員向けに展開を開始しました。このプラットフォームは将来的にサードパーティ開発者にも提供される可能性があります。この動きはAppleの独自AI開発努力とSwift Assistにとって重要な意味を持つものとなっています。
ELYZAが日本語の論理的思考能力を強化した「ELYZA-Thinking-1.0」を公開
株式会社ELYZAは、日本語における論理的思考能力を強化した大規模言語モデル「ELYZA-Thinking-1.0-Qwen-32B」を開発・公開しました。このモデルはMCTS(モンテカルロ木探索)を用いた推論パス探索と模倣学習により開発された「Reasoning Model」で、320億パラメータながらOpenAIの「o1-mini」に匹敵する性能を達成しています。また同時に、推論をショートカットする「ELYZA-Shortcut-1.0」シリーズも商用利用可能な形で公開されました。
Google の研究AIエージェント「AMIE」が視覚能力を獲得し、マルチモーダル診断対話が可能に
Googleは研究用診断AIエージェント「AMIE」に視覚能力を追加し、臨床会話中に画像などの視覚的医療情報を要求、解釈、推論できるようになったことを発表しました。専門家による評価(OSCE)では、マルチモーダルAMIEはプライマリケア医師と比較して、診断の正確性、管理推論、共感性などの主要指標で同等以上のパフォーマンスを示しました。Gemini 2.5 Flashモデルを使用した予備実験では、Top-3診断精度と管理計画の適切性において統計的に有意な向上が見られ、将来のさらなる改善の可能性が示唆されています。
中国アリババQwen、日本製AIの土台に 性能ランクDeepSeek超え
AWS、GitHubでAmazon Q Developer(プレビュー版)を提供開始
Amazon Q DeveloperがGitHubでプレビュー版として利用可能になりました。このツールを使用することで、開発者はGitHub上でコード生成、コードレビュー、およびJavaコード変換機能を直接利用できます。AWS環境のセットアップなしで無料で利用でき、開発プロセスを効率化することが可能です。
GoogleがAIチャットボット会話内にAdSense広告の表示を開始
GoogleがAIチャットボットの会話内にAdSense広告を表示する取り組みを開始しました。GoogleはiAskやLinerなどのAIスタートアップと連携して2024年に広告表示のテストを実施済みとのことです。この動きは、AIチャットボットの普及によって変化するユーザー行動に対応し、同社の主要収入源である広告収益を維持・拡大する狙いがあるとみられています。
Anthropic APIにウェブ検索機能が導入、最新情報へのアクセスが可能に
AnthropicはAPI上でClaudeにウェブ検索機能を追加したことを発表しました。この新機能により、開発者はClaudeを活用したアプリケーションやエージェントに最新情報を取り込むことが可能になります。ウェブ検索を有効にすると、Claudeは金融サービス、法律調査、開発ツールなど様々な分野での最新データにアクセスでき、信頼性の高い回答を提供できます。
GoogleがGemini 2.0 Flashの画像生成機能をアップデート
Googleは開発者向けに、Gemini 2.0 Flashモデルによる画像生成・編集機能をプレビュー版として提供開始しました。この新バージョンでは、以前の実験版と比較して視覚的品質の向上、テキストレンダリングの精度向上、フィルターブロック率の大幅な低減といった改善が施されています。開発者はGoogle AI StudioやVertex AIを通じて「gemini-2.0-flash-preview-image-generation」というモデル名で、より高いレート制限と価格設定で会話型の画像生成・編集機能を統合できるようになりました。
Comentários