3/19 ~ 3/26の注目AIニュース
- Holidayスタッフ
- 3月27日
- 読了時間: 20分
更新日:3月31日

Googleが最も高性能なAIモデル「Gemini 2.5」を発表
Googleは最新のAIモデル「Gemini 2.5」を発表しました。このモデルは高度な「思考能力」を備え、回答前に推論プロセスを経ることで精度と性能が向上しています。初めてのリリースとなる「Gemini 2.5 Pro Experimental」は、複数のベンチマークで最先端の成績を収め、特に数学、科学、コーディング分野で優れた能力を発揮しています。また、100万トークン(近く200万トークンに拡張予定)という長い文脈窓を持ち、テキスト、音声、画像、動画、コードなど多様な情報源を理解できるマルチモーダル機能を備えています。Gemini 2.5 ProはGeminiやGoogle AI Studioから利用できます。
OpenAI、GPT-4oに画像生成機能を搭載
OpenAIはGPT-4oに高度な画像生成機能を統合しました。この新機能は正確なテキストレンダリング、詳細な指示への対応、複数ターンでの画像の改良などが特徴です。従来の装飾的な画像生成を超え、ダイアグラム、インフォグラフィック、テキスト付き画像など実用的な視覚的コミュニケーションツールとして利用できます。Plus、Pro、Team、無料ユーザー向けに提供が開始され、今後数週間でAPI経由でも利用可能になる予定です。
Microsoft、OpenAIの技術活用した「Researcher」と「Analyst」機能をCopilotに導入
Microsoftは、Microsoft 365 Copilotに「Researcher」と「Analyst」という2つの推論エージェントを導入することを発表しました。「Researcher」はOpenAIのDeep Research modelを活用し、複雑な調査研究を支援する機能で、社内データとウェブ情報を組み合わせた高品質な分析を提供します。一方の「Analyst」はOpenAIのo3-mini推論モデルをベースに構築され、データサイエンティストのように思考してPythonを実行し、複雑なデータクエリに対応できます。これらの新機能は4月からMicrosoft 365 Copilotライセンスを持つ顧客向けに「Frontier」プログラムとして提供される予定です。
DeepSeek、性能を大幅に向上させた「DeepSeek-V3-0324」をリリース
DeepSeek が大規模言語モデル「DeepSeek-V3」のアップデート版「DeepSeek-V3-0324」を公開しました。新バージョンは前モデルよりも高速化し、Claude 3.7 Sonnetと比較して入力コストが21分の1、出力コストが53分の1という圧倒的なコスト効率の良さも注目されています。ベンチマーク上ではClaude 3.5 Sonnetを超える結果も出ており、「最高の非推論モデル」との声もあります。
AI向け学習データ提供、同意不要に
政府の個人情報保護委員会は、AI学習用データに限り本人同意なしで第三者提供を可能にする法改正を検討しています。2026年にも学習データが枯渇するとの懸念から、企業内データの活用を促しAI開発を後押しする狙いです。
ClaudeがWeb検索機能を搭載
Claudeに新たにWeb検索機能が追加され、インターネット上の最新情報にアクセスできるようになりました。この機能により、Claudeはより正確で最新の情報に基づいた回答を提供できるようになり、Webから得た情報には出典が明記されます。現在、米国の有料ユーザー向けに提供が開始されており、無料プランユーザーや他国へのサポート拡大も予定されています。
ソフトバンクG、米半導体設計アンペア買収 1兆円規模
ソフトバンクグループは、AI向け高効率半導体を手掛ける米アンペアを約9730億円で買収し、傘下のアームを補完すると発表しました。買収は2025年後半に完了予定で、資金はみずほ銀行などからの借入で調達し、規制当局の承認を経る見込みです。
Googleが「Gemini」に新機能「Canvas」と「Audio Overview」を追加
Googleは、AIアシスタント「Gemini」に新たな共同作業・創作機能として「Canvas」と「Audio Overview」を追加したことを発表しました。「Canvas」はGemini内の新しいインタラクティブスペースで、ドキュメントやコードをリアルタイムで共同編集でき、HTMLやReactなどのウェブアプリケーションのプロトタイプを視覚的にプレビューする機能も備えています。また「Audio Overview」は、ドキュメントやスライド、Deep Researchレポートをポッドキャスト形式の会話に変換し、2人のAIホストによる生き生きとした議論として聴くことができる機能です。両機能はGeminiとGemini Advancedのユーザーに向けて提供開始されています。
SalesforceのCEOが「AI導入が成功したので今年はエンジニアを雇わない」と発言
Salesforce CEOのマーク・ベニオフ氏は決算発表で、同社が開発・利用するAIエージェントの成功により、今年はエンジニアの採用を行わない方針を明らかにしました。サンフランシスコ最大の民間雇用主である同社のCEOは「我々は人間だけを管理する最後の世代だ」と述べ、将来の企業は人間とデジタルの混合労働力を持つようになると予測しています。Salesforceは昨年末に発表した「Agentforce」を通じて顧客ケースやマーケティングキャンペーンなどのタスクをAIに委託するサービスを提供しており、過去90日間だけで38万件の会話を84%の解決率で処理し、人間によるエスカレーションが必要なケースはわずか2%だったとしています。
Googleが、LLMに並列で回答を多数生成させ優れたものを選択させることで性能を引き上げられる手法を考案
Googleの新たな研究で、単純なランダムサンプリングと自己検証の組み合わせによってAIモデルの性能を劇的に向上できることが示されました。この研究ではGemini 1.5モデルを使用し、200回のランダムサンプリングと自己検証だけで、OpenAIのo1-Previewを上回り、o1に近い性能を達成しました。研究者らによると、テスト時の計算リソース活用には「多くの解を探索する」「各解を時間をかけて推論する」「モデル自体を改善する」という3つの軸があり、特に「探索」はスケーラブルで上限がないという特徴があります。興味深いことに、モデルのスケールが大きくなると自己検証能力も向上し、多数の解答候補から正解を特定する精度が高まることが判明しました。
GoogleがLLMがユーザーとの会話を長期的に覚えておく能力を改良する方法を開発したと報告
Googleの研究チームはLLMが長期的な会話履歴を効果的に記憶・活用できる「反省的記憶管理(Reflective Memory Management:RMM)」を開発しました。この新技術は「先週ペットについて話した」「今月初めに旅行計画を立てていた」といった過去の会話を、単に時系列で保存するのではなく、トピックごとに整理して柔軟に引き出せるようにします。RMMは前向きな「予測的反省」と後ろ向きな「回顧的反省」を組み合わせ、発言・ターン・セッションといった異なる粒度で会話を要約し、さらに強化学習を用いて情報検索を改善します。LongMemEval評価データセットでは従来の記憶管理なしの手法と比較して精度が10%以上向上し、AIが人間との長期的な関係構築において重要な「記憶力」を大幅に改善することが実証されました。
Microsoftが「Playwright MCP」を発表。AIによるブラウザ自動操作が高性能に
MicrosoftがPlaywrightベースの新しいModel Context Protocol(MCP)サーバーである「Playwright MCP」を発表しました。このサーバーは、画像認識を必要とせずに構造化されたアクセシビリティデータを活用し、AIモデルによるウェブブラウザ操作を可能にします。従来のブラウザ自動操作と比べ、AIとの相性も良く、また画像認識を必要としないため高速かつ正確になります。スナップショットモードとビジョンモードの2種類の操作方法を提供しており、ウェブナビゲーション、フォーム入力、データ抽出などの自動化タスクに対応しています。
OpenAIが無料のAI動画教材サイト「OpenAI Academy」を一般公開
OpenAIが、AIリテラシーを支援する完全無料のオンラインリソースハブ「OpenAI Academy」の次のフェーズを発表しました。このプラットフォームは、教育者、学生、求職者、非営利団体のリーダー、中小企業経営者など幅広い学習者を対象に、AIをより効果的かつ責任を持って活用するためのツール、ベストプラクティス、洞察を提供します。今後数ヶ月間で、ジョージア工科大学やマイアミデイド大学などの高等教育機関、グッドウィルなどの職業団体、およびCommon Sense Mediaなどの非営利団体との協力により、サービスをさらに拡大していく予定です。
ChatGPTの音声会話機能「Advanced Voice Mode」がアップデート
OpenAIは、ChatGPTでリアルタイム会話を可能にするAI音声機能「Advanced Voice Mode」のアップデートを発表しました。このアップデートにより、AIアシスタントはよりパーソナルになり、ユーザーの発言を遮ることが少なくなります。無料ユーザーも新バージョンにアクセスでき、会話中に考えるために一時停止してもAIに遮られることがなくなります。有料プランのユーザーには、中断が少なくなるだけでなく、よりパーソナリティ豊かな音声アシスタントが提供されます。
OpenAI、ChatGPTでの画像編集機能の導入間近か
ChatGPTのAndroidベータ版にて画像編集機能を示すツールチップが確認されたとの報告があり、OpenAIが近々この機能を導入する可能性が高まっています。同様の機能はGrokにも最近追加されており、両社の競争が激化していることを示しています。また、この動きはChatGPTにネイティブの画像生成機能が追加される兆候かもしれません。
OpenAIの動画生成モデル「Sora」がクレジット制を撤廃し無制限で利用可能に
OpenAI、次世代音声モデルをAPI経由で開発者に提供開始
OpenAIが高精度な音声認識と自然な音声合成を可能にする次世代音声モデルの提供を開始しました。新しい「gpt-4o-transcribe」と「gpt-4o-mini-transcribe」モデルは従来のWhisperモデルと比較して単語エラー率が改善され、特にアクセント、騒がしい環境、話速の変化などの難しい状況での認識精度が向上しています。また初めて、テキスト音声変換モデル「gpt-4o-mini-tts」では開発者が「何を言うか」だけでなく「どのように言うか」を指示できるようになりました。
OpenAI CEOサム・アルトマンがインタビューでChatGPT誕生秘話を語る
OpenAIのエージェントがDoorDashなど消費者向けアプリにリスクをもたらす可能性
OpenAIが開発中のウェブブラウザ使用エージェント「Operator」が、DoorDashなどの消費者向けアプリのビジネスモデルに重大な影響を与える可能性が指摘されています。OpenAIは「Operator」のリリースに先立ちDoorDashにローンチパートナーになるよう依頼しましたが、人間ではなくAIボットがウェブサイトを訪問するようになれば広告価値の低下など、消費者向けアプリのビジネスに悪影響を及ぼす懸念があります。小売業者やサービス提供企業がこの脅威を回避する方法としては独自のAIエージェントを構築することが考えられますが、OpenAIがウェブサイト運営者や小売業者に対して優位性を確立する可能性も懸念されています。
OpenAI o1-proのAPIが公開
Anthropic、新たな収益源を求めてビジネスユーザーに注力へ
Anthropicが、一般消費者向け市場での普及よりもビジネスユーザー向けの機能開発に注力する方針を明らかにしました。同社の最高製品責任者マイク・クリーガー氏は「会議やExcel、Google Docsで一日を過ごす人々の知識労働を支援する」ことに焦点を当てていると語りました。Anthropicは現在、営業担当者向けに顧客との会議前に内部・外部情報を分析してレポートを作成する機能や、音声駆動AIシステムの開発を進めています。同社は今月35億ドルの資金調達を完了し、企業価値は600億ドル超に達していますが、APIを通じた開発者・企業向け収益は消費者向けサブスクリプションの2倍の速さで成長しているとのことです。
Anthropic、AIエージェントの強化に「think」ツールを導入—複雑な問題解決能力が大幅に向上
Anthropicは、自社の大規模言語モデル「Claude」の複雑な問題解決能力を向上させる新たな「thinkツール」を発表しました。このツールは、Claudeがタスク実行中に立ち止まって考える専用のスペースを提供し、複雑なツール使用状況において構造化された思考を可能にします。テスト結果では、航空業界の複雑なポリシー対応シナリオで最大54%の性能向上が確認されました。「拡張思考」機能とは異なり、このthinkツールはClaudeがレスポンス生成を始めた後に追加の思考ステップを挿入するもので、ツール呼び出しの長い連鎖や複数ステップの会話に特に効果的です。開発者はシステムプロンプトに具体的な例を含めることで、さらに効果を高めることができます。
Claude、Googleカレンダー・Gmailとの連携機能を新たに追加
ClaudeがGoogle CalendarとGmailとの統合を実現しました。この新機能では「仕事の会議のバランスを取る」「スケジュールの空き時間を見つける」「メールから会議の詳細を抽出する」「未回答のメールを特定する」などの専用プロンプトが用意されています。また、プロンプト作成画面も刷新され、「extended thinking」や「Compass」機能のトグルが追加されました。
Grokに画像編集機能が追加
Grok、検索機能を強化した「DeeperSearch」を発表—既存の「DeepSearch」からアップグレード
Xの親会社であるxAIが開発するチャットAI「Grok」が、検索機能の強化版「DeeperSearch(ディーパーサーチ)」を発表しました。この新機能は既存の「DeepSearch」からアップグレードされたもので、ウェブ検索能力がさらに向上していると見られます。詳細な機能や改善点については、発表直後のため詳細は明らかになっていませんが、より深い検索と情報収集能力を備えていることが名称から推測されます。
NVIDIA、AIの推論時代に向けた「Blackwell Ultra」プラットフォームを発表
NVIDIAはAIの推論能力を強化する次世代プラットフォーム「NVIDIA Blackwell Ultra」を発表しました。昨年発表された「Blackwell」アーキテクチャをベースに構築されたこの新プラットフォームは、72個のBlackwell Ultra GPUと36個のArm Neoverse搭載NVIDIA Grace CPUを接続する「GB300 NVL72」と「HGX B300 NVL16」システムを特徴としています。GB300 NVL72は前世代のGB200 NVL72より1.5倍のAI性能を実現し、推論時のテスト時スケーリングを強化することで、AI推論、エージェント型AI、フィジカルAIなどの高度なAIアプリケーションの実行を加速します。また、新たにオープンソースの推論フレームワーク「NVIDIA Dynamo」も発表され、スループットの向上と応答時間の短縮、モデル提供コストの削減を実現します。
サイバーエージェントグループ、企業向けAIエージェント構築プラットフォーム「AI Worker」の提供を開始
株式会社サイバーエージェントの100%子会社である株式会社AI Shiftは、企業向けAIエージェント構築プラットフォーム「AI Worker」を提供し、Oracle Autonomous Databaseとの連携を発表しました。近年、業務効率化を目的にAIエージェントの活用が注目される一方、導入には業務要件への適応やデータ管理などの課題が伴います。「AI Worker」は、ワークフロー型と自律型のAIエージェントを提供し、直感的なインターフェース、統合管理、戦略から運用までの支援体制を備えることで、企業のAI活用を加速させます。
ソフトのサイバー弱点、AIエージェントが診断 GMO系
損保ジャパンとリコー、保険業務に特化したマルチモーダルのLLMを共同開発へ
損保ジャパンとリコーは、保険業務に特化したプライベートLLMを共同開発し、照会対応業務の効率化を目指すと発表しました。2024年12月から開発を進め、損保ジャパンのマニュアル等を学習させた上で性能検証を行う予定です。
オタフクがソース開発にAIを導入 1万超のレシピから近い味を探し出す
AI画像生成の新王者、Reve Image 1.0が登場
Reve AI社が、プロンプト忠実性、美観、タイポグラフィに優れた最新のテキスト-画像生成モデル「Reve Image 1.0」を正式に発表しました。現在preview.reve.artで無料提供されており、高度なプロンプトエンジニアリングなしで直感的に画像生成が可能です。第三者評価サイトArtificial Analysisでは、すでに「画像生成品質」部門で首位に立ち、Midjourney v6.1、Google の Imagen 3、Recraft V3、FLUX.1.1 [pro]などの競合を上回る性能を示しています。
Zapierのような連携ツール「n8n」が約90億円調達、AI対応で急成長
ワークフロー自動化プラットフォーム「n8n」が約6,000万ドル(約90億円)の資金調達に成功しました。同社はZapierのように異なるアプリ同士を連携させるサービスを提供していましたが、2022年にAI対応へと戦略転換したことで売上が5倍に急増しています。Highland Europeをリードインベスターとする今回の資金調達により、「フェアコード」の先駆者として知られるn8nは、技術開発の強化と米国市場などへの事業拡大を進める予定です。
ZapierがAIアシスタント向けMCPサービスを発表、8,000以上のアプリと連携可能に
Zapierは、AIアシスタントを様々なアプリケーションと簡単に連携させる新サービス「Zapier MCP」を発表しました。このサービスは複雑なAPI連携不要で、8,000以上のアプリと30,000以上のアクションに直接アクセスできる機能を提供します。Slackやグーグルワークスペース、HubSpotなど多数のビジネスツールとの連携により、AIアシスタントは単なる会話ツールから実用的なアプリケーション拡張へと進化することが期待されています。
Qwen2.5-VL-32Bモデル発表。よりスマートで軽量化された視覚言語AI
Qwenチームが新たに発表したQwen2.5-VL-32Bモデルは、人間の好みに合わせた応答、数学的推論能力、詳細な画像理解と推論の3つの特徴を備えています。同スケールの競合モデルよりも優れたパフォーマンスを示し、特にMMUやMathVistaなどの複雑な推論を必要とするマルチモーダルタスクで顕著な成果を上げています。Qwenチームは今後の研究方向として、複雑な視覚推論タスクに対応するための「長く効果的な推論プロセス」の開発に注力する予定です。
MCP:AI用ツールの標準プロトコルが描く新時代—開発者エコシステムが急速に形成中
Model Context Protocol(MCP)は、AI模型が外部ツールやデータ、APIと効率的に連携するための標準インターフェースとして2024年11月に導入され、開発者コミュニティで急速に注目を集めています。このオープンプロトコルにより、AIエージェントは状況に応じて適切なツールを選択し、タスクを自律的に実行できるようになりました。現在はCursorなどのコードエディタでの活用が中心ですが、プロトコルの進化に伴いさまざまな業種向けのクライアントも登場しつつあります。しかし、認証・認可の標準化やサーバー検出の仕組み、実行環境の整備など解決すべき課題も多く残されています。MCPが広く採用されれば、ツールの開発・利用・収益化の方法が根本的に変わり、AIとソフトウェアの関係性を再定義する可能性があります。
視覚を持つLLMが画像に基づいて質問に正解したとしても、「画像の正しい部分を見ている」かどうかは分からないという研究結果
研究者らは大規模視覚言語モデル(LVLM)の視覚認識プロセスを可視化する新手法を開発し、AIが画像に基づく質問に正しく答えていても、実際には画像の関連部分を見ていない「ショートカット学習」の事例を発見しました。この現象では、モデルが視覚情報を適切に処理せず、言語能力だけで「正解らしい回答」を生成していることが判明しています。また逆に、画像の正しい部分に注目していても最終的な答えを誤るケースも確認されました。研究チームによると、視覚に基づく回答能力はモデルサイズに必ずしも比例せず、モデルの構造によって「注意の向け方」も異なることから、マルチモーダルLLMの使用においては各モデルの特性を理解することが重要だと強調しています。
v0がデータベース連携機能を強化。既存のデータベースとの接続が簡単に
データベース連携機能がAI開発プラットフォーム「v0」に追加されました。この新機能により、v0は接続されたデータベースのスキーマを自動的に認識できるようになります。ユーザーは既存のデータベースをv0に簡単に接続できるようになりました。
Vive CodingとAIコーディングの違いと使い分け
「バイブコーディング」という用語が注目を集めていますが、その定義が誤解されつつあります。Andrej Karpathyが2025年2月6日に生み出したこの言葉は、「コードの存在を忘れ、完全に直感に任せる」プログラミングスタイルを指しており、AIが書いたコードをレビューせずに使用することが特徴です。しかし、これはAIを活用したプログラミング全般とは異なります。プロの開発者はAIが生成したコードを精査し、セキュリティやパフォーマンスを確認した上で使用します。バイブコーディングは低リスクの個人プロジェクトには適していますが、セキュリティが重要な場面や他者が使用するソフトウェアでは注意が必要です。
VCの仕事のうち「ソーシングの90%、案件選択の50%はAIに代替可能」と予測
ロサンゼルスで開催された「Upfront Summit 2025」にて、セコイア・キャピタルのパートナーであるパット・グレイディ氏が登壇し、Axiosのダン・プリマック氏との対談を行いました。グレイディ氏は、ベンチャーキャピタル(VC)業界の現状とAIの将来的な影響について言及し、VCの仕事のうち、案件発掘の90%と、案件選択の50%はAIによってプログラム化できる可能性があると述べました。一方で、最終的な投資判断には依然として人間の判断が必要であり、起業家との関係構築はAIには代替できないとも語りました。
「AIエージェントのムーアの法則」が発見。AIが完了できるタスクの長さは7ヶ月で2倍に
METRは、AIシステムが自律的に実行できるタスクの長さが約7ヶ月ごとに倍増するという「AIエージェントのムーアの法則」と呼べる傾向を発見したと発表しました。この研究ではHCASTなどのベンチマークを用いて、熟練した人間とAIシステムに同様の条件でタスクに挑戦させ、人間が完了するのにかかる時間(1秒から16時間まで)と、AIの成功率の関係を分析しました。研究チームは人間のタスク完了時間に基づいてAIの成功率を予測する曲線を作成し、AIのタスク完了率が50%となる時間を「タスク完了時間の地平線」として定義することで、AIの自律性の進化を追跡する新たな指標を確立しました。
記憶を代行するAI「Second Me」が登場。面倒な個人情報の入力から解放される日が近づく
あなたが様々なサービスで繰り返し入力している個人情報を覚えておき、必要な時に自動で活用してくれる「Second Me」が開発されました。このAIシステムは、まさに「もうひとりのあなた」として働き、ウェブサイトやアプリで何度も同じ情報を入力する手間から解放してくれます。あなたのメモや文書から重要な情報を学習し、文脈に合わせて適切に取り出すので、テキスト入力の自動化やアプリを横断した一貫した体験が可能になります。この技術はすでにオープンソースとして公開されており、近い将来、私たちのデジタルライフをより快適にする可能性を秘めています。
Cloudflare、AIクローラー対策に「AI Labyrinth」を導入—無断スクレイピングをわざと迷路に誘導
Cloudflareは、許可なくウェブサイトのコンテンツを収集するAIクローラーに対抗する新たな手法「AI Labyrinth」を発表しました。この機能は不審なボットを検出すると、ブロックする代わりに生成AIで作られた無関係なページへと誘導し、クローラーのリソースを浪費させる仕組みです。これはAI企業によるウェブスクレイピングの急増に対応するもので、Cloudflareのネットワークでは毎日500億以上(全リクエストの約1%)がAIクローラーからのリクエストだと報告されています。通常のユーザーには見えない隠しリンクを辿るボットは自動的に検出され、Cloudflareの機械学習モデルに情報が蓄積されます。この「AI Labyrinth」機能は無料プランを含むすべてのユーザが利用できます。
新AIモデル「GATE」が予測:AIと経済成長の新時代—年間30%成長と数十年内の完全自動化
EpochAIは、AI技術のスケーリングと自動化が経済成長に与える影響を予測する「GATE」と呼ばれる新しいモデルを発表しました。このモデルによると、今後数十年でコンピューティング基盤に兆単位のドル投資が行われ、年間30%の経済成長率が実現し、最終的には労働の完全自動化に至る可能性があります。研究者らはパラメータを様々に変更してシミュレーションを行いましたが、こうした変革的な結果を回避することは驚くほど困難だと述べています。GATEは経済学とAIスケーリング則を融合させ、コンピュート能力の増加が自動化を促進し、それが成長と半導体関連インフラへの投資を生み出すという循環を示しています。一般ユーザーも対話型サンドボックスで様々なシナリオを試すことができます。
AIチューターで学力急上昇、テキサスの私立校が全米上位2%の成績を達成
テキサス州オースティンにある私立「アルファスクール」が、人工知能(AI)チューターを導入した結果、生徒の学力テストの成績が急上昇し、全米トップ2%に達したと報告しています。この学校では、生徒たちが毎日2時間AIアシスタントと一緒に授業を受け、残りの時間はパブリックスピーキング、金融リテラシー、チームワークなどのスキル習得に充てています。アルファスクールの共同創設者マッケンジー・プライス氏によると、「AIチューターと適応型アプリを使用して完全にパーソナライズされた学習体験を提供した結果、生徒たちはより速く、より効果的に学んでいます」とのこと。生徒たちは1日3時間で学業を終え、残りの時間は「情熱プロジェクト」に取り組んでいます。この教育モデルでは、AIがパーソナライズされた学習を担当し、教師は生徒と直接関わり、モチベーションや感情面のサポートを提供する役割を果たしています。現在数百人の生徒が在籍するアルファスクールは、全米に拡大中です。
AIチャットボットと感情的交流:音声モードは短期使用で好影響、長期使用では悪影響と研究結果
OpenAIとMIT Media Labの共同研究により、ChatGPTなどのAIチャットボットと人間の感情的交流に関する調査結果が発表されました。研究によると、音声チャットは短時間利用なら孤独感を和らげる可能性がある一方、長時間使用すると依存や対人交流の減少が生じやすいことが判明しました。また、個人的な話題での会話は孤独感の増加と関連する反面、感情的依存や問題的利用はむしろ抑制される傾向にあり、この研究は高度なAIモデルが人々の幸福感に与える影響を理解するための重要な第一歩となっています。
TIS、生成AIを活用したテスト仕様書作成の自動化で工数40%削減に成功
TISのテクノロジー&イノベーション本部が生成AIを活用したテスト仕様書の自動生成に取り組み、従来の手作業と比較して約4割の工数削減に成功しました。設計書とテスト観点カタログを入力として、AWS BedrockのClaude SonnetおよびHaikuを用いたテスト仕様書生成システムを構築しています。生成されたテスト仕様書の評価では、テスト観点判断の正答率が約90%、高品質なテストケース生成率が51〜67%に達しました。今後は大規模機能への対応やレビュー容易性の向上などの課題に取り組む予定です。
Comments