初心者必見!凡人AIブロガー・パンくんが選ぶ今週のAIニュース【Google最新画像AIを発表&OpenAI最新の音声モデル発表など】(8/25〜8/31)

Uncategorized

今週も「AIの情報の波についていけない、、、」そんなあなたに読んでほしいAIの最新情報をまとめました!
先週に続き googleの新機能追加やOpenAIから最新の音声モデルが追加 されるなど、たくさんのアップデートがあった一週間となりました。
その中から僕が厳選したAIニュースをピックアップしました。

第一部 では初心者の人でも無料ですぐに使える機能や話題性のある機能を
第二部 ではもっと知りたい人向けに最新のAIニュースをまとめています。

この記事を読めば今週あったAIニュースを把握できますよ。
それでは今週もいってみよう!

第一部:初心者でも無料ですぐ使えるAI機能

Google最新画像AI「Gemini 2.5 Flash Image(nano-banana)」が無料公開

2025年8月26日、Googleは次世代の画像生成・編集モデル「Gemini 2.5 Flash Image(通称 nano-banana)」を正式に発表しました。Geminiアプリでは誰でも無料で使えるようになり、人やペットの一貫した見た目を保ちながら、衣装変更・背景編集・スタイル変換など多彩な編集が可能です。
たとえば「服装を夏服に変えて」「背景をビーチに」など、自然な指示だけで高度な画像編集を実現できます。

このモデルは、従来よりも生成速度が高速化されており、複数の画像を並べて指示することで一貫性のある人物やキャラクターを維持することもできます。
また、既存の写真をベースに「部分的に修正する」「新しい背景を合成する」といった実用的な編集作業にも対応しています。さらに、学習済みの世界知識を活かして、コンテキストに沿ったリアルで自然な編集結果を返すのも特徴です。

開発者や企業向けには Gemini API、Google AI Studio、Vertex AI でも利用可能になっています。これにより、開発者は自然言語でのプロンプトを活用してアプリに画像生成を組み込んだり、ビジネス用途でブランド一貫性を保ったビジュアルを作成したりといった応用が可能になります。

公式ブログはこちら(Google Keyword)

正直この機能を使ってみてびっくりしました。実際に自分の冬服の写真をGeminiに送って「夏服にして」と入力したら、本当に夏服に変えてくれたんです。顔写真を載せるのは恥ずかしいのでここでは言葉だけで説明しますが(笑)、これは実際に自分でやるほうが凄さを実感できると思います。ぜひ一度試してみてください!

OpenAIの新音声モデル「gpt-realtime」をChatGPTアプリで無料体験

2025年8月28日、OpenAIは音声に特化した新モデル「gpt-realtime」を発表し、Realtime APIを正式にリリースしました。このモデルは処理速度が大幅に改善され、 音声のイントネーションや感情表現も自然に表現できる のが特徴です。新しい声として「Cedar」「Marin」も追加され、より会話に近い体験が可能になりました。

「gpt-realtime」は開発者向けに提供されるRealtime APIとして従量課金で利用できますが、ChatGPTアプリの音声通話(Voice Mode)では無料で体験できるように順次展開されています。日常的な音声会話をAIと自然に行えるようになり、まるで人と話しているような体験ができるのが魅力です。

公式発表はこちら(OpenAI)

このアップデートは凄く良いですね!僕もたまにChatGptの音声通話を使いますが、確かに返答までのタイムラグが気になっていました。これが改良されて、もっとスムーズに会話ができるようになったので是非試して見たいと思います!ちょっと友達と会話する回数が減りそうで怖いですが(笑)

第二部:もっと知りたい人向けのAIニュース

Google翻訳が進化!リアルタイム翻訳と学習モードが無料で登場

2025年8月26日、GoogleはGoogle翻訳アプリにAIによる「ライブ翻訳」と「パーソナライズされた語学学習機能」を導入しました。どちらも完全無料で使える機能です。

「ライブ翻訳」は、アプリを開いて“Live translate”をタップし、会話を始めるだけで 70以上の言語をリアルタイムで双方向翻訳。音声も字幕も表示され、話すたびに自然に切り替わります。さらに、空港やカフェなど雑音の多い環境でもスムーズに翻訳してくれるんです。

もう一つの「語学学習機能」は、”Practice”ボタンをタップして自分のスキルレベル(初級・中級・上級)と目的(旅行/仕事など)を選ぶと、AIがその場でリスニング/スピーキング練習を生成
対話を聴いて認識した単語をタップしたり、発話練習とヒントが提示されたりします。進捗も記録され、まるでパーソナライズされた講師がいるような感覚に。

完全無料のアップデートだが、現在は米・インド・メキシコ限定。日本を含む他の地域は今後展開予定とのことです。

公式ブログはこちら(Google Keyword)

このニュースを見た時「ブルーロック出でてくる耳につけて即翻訳してくれる装置」を思い出しました(笑)。ブルーロックを見ていない方はよくわからないかもしれませんが、アニメで使用されていた技術に現実が追いついてきていると考えると凄くないですか?毎週技術の進化に驚かされます。

ClaudeがChromeに登場!「Claude for Chrome」拡張機能を発表

Anthropicは2025年8月26日、Chrome用の新しい拡張機能「Claude for Chrome」を研究プレビューとして発表しました。この拡張はChromeブラウザ上にサイドパネルとして表示され、 ページ内容を理解してクリックや入力、フォーム操作などを代行することが可能 です。
Googleカレンダーの予定管理、会議スケジュールの作成、メールの下書き、請求書処理など幅広いタスクで効率化が期待されています。

ただし、ブラウザ操作をAIに任せることにはリスクもあります。Anthropicはプロンプトインジェクション攻撃の危険性を公式に説明しており、 内部テストでは攻撃成功率が23.6%から11.2%に低減したと発表 しました。
さらに、アクセス制御やユーザー確認プロンプト、金融や違法コンテンツサイトへのアクセス禁止など複数の防御策が組み込まれています。

現在はAnthropicのMaxプラン加入者1,000名限定で先行提供されています。今後はMaxユーザー以外にも段階的に公開予定で、一般利用の前に安全性を徹底的に検証するとしています。

公式発表はこちら(Anthropic News)

僕が思ったのはGoogleと連携するの凄いなって思いました。GoogleとClaudeはいわば敵同士なわけじゃないですか。それなのに連携してもっとユーザーが便利になる機能を追加してくれてほんとうにありがたいなと思います。今後セキュリティが強化され一般利用が展開されたら、是非使ってみたいです!

ChatGPTがGmailやGoogleカレンダーと連携!公式コネクタが追加

2025年8月25日、OpenAIはChatGPTに Gmail、Googleカレンダー、Googleコンタクトとの公式コネクタ を追加しました。これらの連携を有効にすると、チャット中に自動的にこれらのGoogleサービスから情報を引き出して会話に活用できるようになります。

このアップデートにより、例えば「今週の会議は?」や「このメールに返信しておいて」など、わざわざ外部のアプリを開かなくてもChatGPTに頼めるようになり、効率的に作業が進められるようになります。ただし、予定の追加や編集、メールの送信まではできず、現状は参照機能に限られます

連携は PlusやProなどの個人プランにも順次展開中で、Business/Enterprise/Eduプランでは管理者がRolesでアクセス制限できる(RBAC対応)機能も搭載されており、チームで安心して使える仕様です。

公式ドキュメントはこちら(Connectors in ChatGPT)

このアップデートも先ほどのClaudeと同様、Googleサービスと連携できるようになった点が大きな魅力です。僕自身普段からChatGPTをメインに使っているので、この機能追加は本当にありがたいです。現状は予定の確認やメールの要約といった参照のみですが、将来的にカレンダーへ直接予定を追加できるようになれば、さらに便利になると思います。

無料で試せるAI機能、あなたもチェックしてみては?

いかがだったでしょうか。やっぱりAIは記事を読むだけでなく、実際に自分で試してみると理解が深まり、凄さを実感できます。僕自身もGoogleの最新画像AIを使って本当に驚かされました。

今週はまさにAIの進化をまじまじと感じる週でした。アニメで描かれていた技術が、いよいよ現実で使えるようになってきています。このまま進化していけば、本当にドラえもんの世界も夢じゃないかもしれませんね(笑)。今後がますます楽しみです。

来週もAIニュースをまとめた記事をお届けします!さらに役立つ機能解説の記事も少しずつ投稿していけたらと思っているので、ぜひチェックしてください。

コメント

タイトルとURLをコピーしました