2年ぶり、2回目の Quota 大阪オフ会に参加してきました。
- 前回のQuora 大阪オフ会(2024年4月28日)
今回は少し早めに訪れてカフェで歓談、その後オフ会の流れとなりました。
景色の良い場所で、穏やかな雰囲気の中、いろいろなお話が聞けてとても楽しかったです!
いろいろ書いているブログへのポータルサイトみたいな。 たまに日記とか書いたりします。
2年ぶり、2回目の Quota 大阪オフ会に参加してきました。
それまで Chrome拡張機能自体はいくつか作成してきましたが、Chrome ウェブストアで公開するのはどうしたらいいのだろう、と思いました。そこで YouTube Live チャットの要約ツールを探していたこともあって(どれも不要な機能が多くてシンプルなものがほしかった)、作ってみようと思い立ったのでした。
その過程について備忘録として残しておきます。
まず最初にこの拡張機能の説明をしておきます。
2026年3月3日に思い立って、生成AIの Gemini の力を借りつつ生成。
2026年3月9日に公開されました!
Gemini AI を活用した YouTube ライブチャット(アーカイブ含む)のリアルタイム要約。
右サイドパネルで AIがライブの盛り上がりを一定間隔で要約し、所定の言語(Gemini 対応の75言語以上/2026年3月9日時点)で出力するものです。最終的に簡易版と詳細版にわけて、5つのパートにわけて出力しています。プロンプトもカスタマイズできるようにしました。あとウィンドウごとに、すべての「タブ」をチェックするので、複数のタブでライブチャットがあるなら、統合されて表示されます。それぞれのタイトルを表示するので、どのチャットかはわかりやすいでしょう。


拡張機能を開いて、 Service Worker のリンクをクリックしてください。
出てきたウィンドウで「Network」タブを選んでください。
そして Gemini へデータが送信されると、下記の赤枠のように、Status 200(成功)で、Type が fetch、 Name にURLが出てきます。APIキーも表示されますから、スクショなどは他人に見せないでください(下記はAPI部分を塗りつぶしています)。
なお、チャットのちょっとセンシティブな言葉(卑猥そうな言葉など)が入っていると、Gemini API側でエラー(ブロック)になる場合もあります。そうした場合には、Status 200 以外になるのでわかります。
1週間ほど試したぐらいですが、下記のデフォルト値であれば、
使用モデル:2.5 Flash-Lite
要約の間隔(秒)(デフォルト: 30): 30
要約を開始する最小チャット数(この数に達するまで送信を待機します): 5
1回あたりの最大解析文字数(コスト節約のため、超過分はカットして送信します): 2000
支払い登録はした上で、1時間 2円ぐらいを想定したらいい感じかなぁといったところです。*2時間ぐらいのライブ動画のアーカイブを途中で飛ばしながらみるとぐらいなレベル
一番多く使ったのは、文字数制限せずに(0にすると制限無し)、数時間テストでつかっていたときは、入力トークンが 2.5 Flash Lite で 431,504トークンで 7円でした。これは相当いろいろやらないといかないトークンですね。Pro とか使うとかなりコストがかかるので注意!
入力トークン(流れるチャットをどの程度取得するかの文字数)
出力トークン(AIが出力する文字数)
によって変わってくるのであくまで推定値です。
下記は4日間ぐらいでテストもかねて使ったトークンと費用です。あくまで一例です。
使用量RPDは、利用回数です。2.5 Flash Lite は、402回つかって12円。30秒に1度なら、1時間に120回ですから、3時間以上つかって12円といったところでしょうか。ただし、このときはいろいろ実験していたので、想定よりも高いコストを支払っています。3.1 Pro なんて1度しか使っていないのに1円かかっている.. って感じですねぇ。

各モデルの料金体系は、https://ai.google.dev/gemini-api/docs/pricing で公開されています。
推定だと次の通り。あくまで推定のため実際にどの程度かは自分で計測してください。
実行間隔: 30秒に1回(1日 2,880回)
1回あたりの推定量: 入力 2,000トークン / 出力 200トークン
為替レート: 1ドル = 158円(想定)

Google AI Studio 経由で、各モデルごとの1日の使用量合計は簡単にわかりますから(ただし1日経過した後でないと前日分は出てこない模様)、それで確認するのがよいでしょう。

以下、どうやって作ったのか、どうやって登録したのかを書いておきます。
YouTubeライブチャットの人間が見ることができるレベルを超えている流れをみて、Chrome拡張機能でなんとかならないかと探したのですが、余計な機能がついていたり使い方がいまいちわからなかったりしたので、「作ってみるか!」と思ったのでした。
いまなら生成AIなどの助けを借りることで、そこまで苦労しなくても作れるのでは?と思ったのもの大きな点です。そこで Google Gemini のみをつかって作ったのでした(思考モードと 3.1 Pro を併用)。Gemini でどの程度できるだろう、正式登録ぐらいの完成度までいけるか!?ということを知りたいという目的もありました(せっかく Google AI Proを契約しているので)。実際には8割ぐらいまでは手軽にできたものの完成度を上げるためには、生成AI側が機能を忘れたり、勝手に削除したり、特に利用マニュアル系を多言語にすると、日本語以外は存在を忘れたりと、ある程度厳格な指示をしているのにもかかわらず、うまくいかないことがあってかなり格闘しました。
さらにコストをできるだけかからないようにという方向性もっていくと、全くデータを拾わなくなったりなど、相当いろいろ調整しました。
残念ながら、上にスクロールしても途中までしか戻らないので、どの程度の文字数やトークンをつかったかわかりません。下記を見ると、2割ぐらいの分量の気がします。
さて下記を参考に登録してみました。
参考:Chrome拡張機能をChromeウェブストアで公開するまでの手順のまとめ
以下、2026年3月9日時点の情報です。
サポートURLや、プライバシーポリシーの公開などもいるので、ソースを公開していいなら、そうしておいたほうが楽です。
https://github.com/kimipooh/youtube-live-chat-summarizer
Chromeウェブストアデベロッパーダッシュボード
https://chrome.google.com/webstore/devconsole
にアクセスして、同意してから、登録料の支払い(5ドル)を支払いします。
最初に1度だけで維持費などは不要ということです。いいですね!


.DS_Store など不要な隠しフォルダやファイルは削除した上で、拡張機能を ZIP圧縮します。
アイテムから、「新しいアイテム」を選択
圧縮していた Chrome拡張機能をアップロードします。

なお審査前であれば、「パッケージ」から、「新しいパッケージをアップロード」より差し替えができます。
データ使用





まぁただそれだけの話です。AIエージェントを使って手軽に何かをする備忘録として残しておこうかなぁと思った次第です。
さて本日、下記のニュースが目に飛び込みました。
自分の部屋がCIAみたいになる? 国際情勢ダッシュボード「World Monitor」話題 開発は「週末にClaudeで」 - ITmedia NEWS
実際には、下記のURLにアクセスすると、映画で出てくるような世界を監視しているような気持ちにさせるサービスですね。まずは下記にアクセスしてどのようなものか見てみてください。
・https://worldmonitor.app:地政学、軍事、紛争、インフラ ・https://tech.worldmonitor.app:スタートアップ、AI/機械学習、クラウド、サイバーセキュリティ ・https://finance.worldmonitor.app:グローバル市場、取引、中央銀行、湾岸地域への外国直接投資
ローカル環境でも動作させることができるということで、ソースを探すと GitHUBで公開されていました。







前回は、海外に行っていたために参加できませんでした。そのため、2年ぶりの参加です。
今年も実行委員として活動しています。