(Translated by https://www.hiragana.jp/)
Whisperの人気記事 97件 - はてなブックマーク

検索けんさく対象たいしょう

ならじゅん

ブックマークすう

期間きかん指定してい

  • から
  • まで

1 - 40 けん / 97けん

Whisperの検索けんさく結果けっか1 - 40 けん / 97けん

Whisperかんするエントリは97けんあります。 AI人工じんこう知能ちのうOpenAI などが関連かんれんタグです。 人気にんきエントリには 『AI 激動げきどうとし!2022ねん人工じんこう知能ちのう10だいトレンドと必読ひつどく論文ろんぶんなどがあります。
  • AI 激動げきどうとし!2022ねん人工じんこう知能ちのう10だいトレンドと必読ひつどく論文ろんぶん

      AI 激動の年!2022年の人工知能10大トレンドと必読論文
    • 文字もじこしAI「Whisper」をだれでも簡単かんたん使つかえるようにしたちょうこう精度せいど文字もじこしアプリ「writeout.ai」使つかかたまとめ、オープンソースでローカルでも動作どうさOK

      会議かいぎ議事ぎじろくやムービーの作成さくせいなど、文字もじこしが必要ひつよう場面ばめんおおくありますが、手動しゅどうでの文字もじこしは非常ひじょう面倒めんどうです。また、OpenAIせい文字もじこしAI「Whisper」をもちいて文字もじこしする方法ほうほうもありますが、初期しょき設定せっていむずかしいという問題もんだい存在そんざいします。Whisperをメチャクチャ使つかいやすくした無料むりょう文字もじこしサービス「writeout.ai」なら、ちょう簡単かんたんかつ短時間たんじかんこう精度せいど文字もじこしを実現じつげんできるとのことなので、実際じっさい使つかってみました。 writeout.ai – Transcribe and translate any audio file https://writeout.ai/ 上記じょうきのリンクからwriteout.aiにアクセスすると、以下いかのような画面がめん表示ひょうじされます。文字もじこしをおこなうには「Transcribes for free」をクリック。 すると、GitHubアカウントでのサインインをもとめられます

        文字起こしAI「Whisper」を誰でも簡単に使えるようにした超高精度文字起こしアプリ「writeout.ai」使い方まとめ、オープンソースでローカルでも動作OK
      • ちょうこう精度せいど商用しょうよう利用りよう可能かのうじゅん国産こくさん日本語にほんご音声おんせい認識にんしきモデル「ReazonSpeech」を無償むしょう公開こうかい

        株式会社かぶしきがいしゃレアゾン・ホールディングス(本社ほんしゃ東京とうきょう新宿しんじゅく代表だいひょう取締役とりしまりやく渡邉わたなべ しん)は世界せかい最高さいこうレベルのこう精度せいど日本語にほんご音声おんせい認識にんしきモデルおよび世界せかい最大さいだい19,000あいだ日本語にほんご音声おんせいコーパス※「ReazonSpeech」を公開こうかいいたしました。 2023ねん1がつ18にち 株式会社かぶしきがいしゃレアゾン・ホールディングス(本社ほんしゃ東京とうきょう新宿しんじゅく代表だいひょう取締役とりしまりやく渡邉わたなべ しん)は世界せかい最高さいこうレベルのこう精度せいど日本語にほんご音声おんせい認識にんしきモデルおよび世界せかい最大さいだい19,000あいだ日本語にほんご音声おんせいコーパス※「ReazonSpeech」を公開こうかいいたしました。 ※音声おんせいコーパス: 音声おんせいデータとテキストデータを発話はつわ単位たんい対応付たいおうづけてあつめたもの。音声おんせい認識にんしきモデルを作成さくせいする材料ざいりょうとして使用しようされ、その規模きぼ品質ひんしつ音声おんせい認識にんしき精度せいどおおきく左右さゆうする。 ※2「ReazonSpeech」をもちいた文字もじこしサービスをプロジェクトwebサイトにて実際じっさいためすことができます。 プロジェクトwebサイト:https://

          超高精度で商用利用可能な純国産の日本語音声認識モデル「ReazonSpeech」を無償公開
        • 文字もじこしAIでだれでも無料むりょうでYoutubeの字幕じまくファイルをつく方法ほうほう - ニートの言葉ことば

          どうもこんにちは、あんどう(@t_andou)です。 前回ぜんかい宣言せんげんしたとおりにだれでも簡単かんたんにYoutubeの字幕じまくファイルをつく方法ほうほうきます。 「Youtubeの」といていますが、実際じっさいはどの動画どうがでも対応たいおうしてます。 前回ぜんかい記事きじ blog.takuya-andou.com まずはGoogleColabの共有きょうゆう colab.research.google.com 使つかかた GoogleColabに記載きさいしていますが 1.GPUを使用しようするようにじょうの「ランタイム」→「ランタイムのタイプを変更へんこう」からからGPUを選択せんたく 2.みぎじょう接続せつぞく のセルを実行じっこうすると自動的じどうてき接続せつぞくされるので省略しょうりゃく可能かのうです 3.動画どうがをアップロード ここにドラッグ&ドロップでアップできます だい容量ようりょうのデータの場合ばあい、GoogleDriveと連携れんけいしたほう効率こうりつてきです 4.入出力にゅうしゅつりょくのパスの変更へんこう ファイルめいわせて変更へんこうしてください 5.ぜんセルを実行じっこう あと

            文字起こしAIで誰でも無料でYoutubeの字幕ファイルを作る方法 - ニートの言葉
          • OpenAIが高性能こうせいのう文字もじこしAI「Whisper」を発表はっぴょう日本語にほんごにも対応たいおう早口はやくち言葉ことば歌詞かしこう精度せいど文字もじこし可能かのう

            画像がぞう生成せいせいAI「DALL・E 2」や文章ぶんしょう生成せいせいAI「GPT-3」といった高性能こうせいのうAIを開発かいはつしてきたAI開発かいはつ組織そしきのOpenAIが、あらたに音声おんせいちょうこう精度せいど認識にんしきして文章ぶんしょうこせるAI「Whisper」を発表はっぴょうしました。発表はっぴょう同時どうじ公開こうかいされたサンプルでは「早口はやくちのセールストーク」や「ハイテンポなきょく歌詞かし」などの音声おんせいでも問題もんだいなく文字もじこしできる性能せいのうたかさがしめされています。 Introducing Whisper https://openai.com/blog/whisper/ GitHub - openai/whisper https://github.com/openai/whisper Whisperはインターネットじょうから収集しゅうしゅうされた合計ごうけい68まんあいだにおよぶ音声おんせいデータでトレーニングされた文字もじこしAIです。OpenAIのブログ記事きじには「早口はやくちのセールストーク」「K-POPのきょく」「フランス語ふらんすご」「独特どくとくなアクセン

              OpenAIが高性能文字起こしAI「Whisper」を発表、日本語にも対応し早口言葉や歌詞も高精度に文字起こし可能
            • Whisper、ChatGPTを活用かつようした、テキスト入力にゅうりょく不要ふようしん感覚かんかくメモ日記にっきアプリの紹介しょうかいと、開発かいはつにおけるまなび|にょす

              日常にちじょう生活せいかつなかまれた「できごと」や「おもったこと」を、たのしく記録きろくできるメモ日記にっきアプリを開発かいはつしました! しゃべったら、あとはまるげしてかんじにメモをのこしてくれる「シャべマル」です!(笑) シャべマルの紹介しょうかい具体ぐたいてきには、、 絵文字えもじ見返みかえせるメモアプリあんまりないですが、いですよ…!音声おんせい入力にゅうりょくでメモ内容ないよう作成さくせい。かなりこう精度せいど音声おんせい認識にんしきモデル(Whisper)をもちいているので、想像そうぞう以上いじょうにちゃんと文字もじこししてくれます! 「今日きょうあったこと」など、日記にっきとして利用りようするのもオススメです。1にちかえ機会きかいになって、それがこうからかえりできるので、あのときこんなことかんがえていたなー、といった発見はっけんにつながるはずです! そして個人こじんてきにここが目玉めだまなのですが、文字もじこしされたメモには、「タイトル」「絵文字えもじアイコン」「感情かんじょうアイコン」「カテゴリ」が自動じどうひもづきます! これなにいかというと、圧倒的あっとうてき見返みかえしやすくなるんですよね

                Whisper、ChatGPTを活用した、テキスト入力不要な新感覚メモ日記アプリの紹介と、開発における学び|にょす
              • ちょうこう精度せいど国産こくさん音声おんせい認識にんしきAI「ReazonSpeech」が無償むしょう公開こうかいされたので文字もじこし機能きのう使つかってみた

                東京とうきょう拠点きょてんくテクノロジー企業きぎょう「レアゾン・ホールディングス」が、1まん9000あいだおよ国内こくない最大さいだいきゅう日本語にほんご音声おんせいコーパス「ReazonSpeech」を無償むしょう公開こうかいしました。同時どうじに、OpenAIが開発かいはつしたちょう高性能こうせいのう音声おんせい認識にんしきAI「Whisper」に匹敵ひってきする性能せいのうをアピールする文字もじこしサービスも公開こうかいされていたので、実際じっさい使つかってみました。 ちょうこう精度せいど商用しょうよう利用りよう可能かのうじゅん国産こくさん日本語にほんご音声おんせい認識にんしきモデル「ReazonSpeech」を無償むしょう公開こうかい - Reazon Human Interaction Lab https://research.reazon.jp/news/reazonspeech.html ReazonSpeech - Reazon Human Interaction Lab https://research.reazon.jp/projects/ReazonSpeech/ レアゾン・ホールディングスは「R

                  超高精度な国産音声認識AI「ReazonSpeech」が無償公開されたので文字起こし機能を使ってみた
                • 自分じぶん行動こうどう毎日まいにち24あいだ録音ろくおんしてWhisperで文字もじこしする「ぜん自動じどう口述こうじゅつ日記にっき」を1週間しゅうかんつけつづけたエンジニアの報告ほうこく

                  AI研究けんきゅう団体だんたいのOpenAIが開発かいはつした「Whisper」は非常ひじょうたか精度せいど録音ろくおんから文字もじこしをおこなうAIモデルで、オープンソースで無料むりょう公開こうかいされています。エンジニアのロバー・ダム自身じしんのブログで、毎日まいにちスマートフォンに行動こうどう逐一ちくいちみ、その録音ろくおんをWhisperで文字もじこしすることで「ぜん自動じどう口述こうじゅつ日記にっき」をのこすことができるシステムをためした結果けっかについて報告ほうこくしています。 I record myself on audio 24x7 and use an AI to process the information. Is this the future? https://roberdam.com/en/wisper.html ダムぜん自動じどう口述こうじゅつ日記にっきおもいついたのは、以前いぜんから「1TBえのストレージを内蔵ないぞうしたスマートフォンが登場とうじょうすれば、24あいだ365にち録音ろくおんつづけることが可能かのうなのではないか」とかんがえていたことから

                    自分の行動を毎日24時間録音してWhisperで文字起こしする「全自動口述日記」を1週間つけつづけたエンジニアの報告
                  • https://twitter.com/hiraoka_dx/status/1638658560170274818

                      https://twitter.com/hiraoka_dx/status/1638658560170274818
                    • https://twitter.com/buffett_code/status/1605488460659392514

                        https://twitter.com/buffett_code/status/1605488460659392514
                      • PCで再生さいせいちゅう音声おんせいをWhisperでリアルタイムに文字もじこしする - TadaoYamaokaの開発かいはつ日記にっき

                        PCで再生さいせいちゅう音声おんせいをリアルタイムで文字もじこしできると、字幕じまく機能きのうがない動画どうが再生さいせいや、外国がいこくとのオンライン会議かいぎ便利べんりである。 先日せんじつ、OpenAIが公開こうかいしたWhisperは、音声おんせいファイルから文字もじこしするするツールが提供ていきょうされているが、リアルタイムで処理しょりするツールは提供ていきょうされていない。 そこで、Pythonスクリプトで、リアルタイムで文字もじこしするツールを作成さくせいした。 ループバック録音ろくおん SoundCardを使つかうと、PCで再生さいせいされている音声おんせい録音ろくおんすることができる。 pip install SoundCardでインストールする。 import soundcard as sc with sc.get_microphone(id=str(sc.default_speaker().name), include_loopback=True).recorder(samplerate=SAMPLE_RATE, chan

                          PCで再生中の音声をWhisperでリアルタイムに文字起こしする - TadaoYamaokaの開発日記
                        • 無料むりょうでも結構けっこうスゴい!! 文字もじこしAIに録画ろくがしたWeb会議かいぎのテキストをさせてみた!」――急遽きゅうきょテレワークを導入どうにゅうした中小ちゅうしょう企業きぎょう顛末てんまつ(118)【急遽きゅうきょテレワーク導入どうにゅう!の顛末てんまつ

                            「無料でも結構スゴい!! 文字起こしAIに録画したWeb会議のテキスト化をさせてみた!」――急遽テレワークを導入した中小企業の顛末記(118)【急遽テレワーク導入!の顛末記】
                          • OpenAI DevDay で発表はっぴょうされたしんモデルとしん開発かいはつツール まとめ|npaka

                            以下いか記事きじ面白おもしろかったので、かるくまとめました。 ・New models and developer products announced at DevDay 1. GPT-4 Turbo「GPT-4 Turbo」は、「GPT-4」より高性能こうせいのうです。2023ねん4がつまでの知識ちしきと128kのコンテキストウィンドウをちます。さらに、「GPT-4」と比較ひかくして入力にゅうりょくは1/3、出力しゅつりょくは1/2のやす価格かかく提供ていきょうします。 開発かいはつしゃはモデルID「gpt-4-1106-preview」でためすことができます。今後こんごすう週間しゅうかん以内いないに、安定あんていしたじつ稼働かどうモデルをリリースする予定よていです。 1-1. Function Calling の更新こうしん「Function Calling」に、単一たんいつメッセージから複数ふくすうのFunction (「くるままどけてエアコンをオフにする」など) を機能きのうなどが追加ついかされました。精度せいど向上こうじょうしています。 1-2. 構造こうぞう

                              OpenAI DevDay で発表された新モデルと新開発ツール まとめ|npaka
                            • ChatGPT APIとWhisper APIで議事ぎじろく文字もじこしアプリをつくり、Hugging Face Spacesで公開こうかいする | gihyo.jp

                              ChatGPT APIの使つかかた 実際じっさいにChatGPT APIを使つかってみましょう。 openai-pythonのインストール 今回こんかいはOpenAIのPythonようライブラリであるopenai-pythonを使つかいます。pipをもちいて、openai-pythonをインストールしましょう。 pip install openai APIリクエスト ChatCompletion.createで対話たいわ生成せいせいできます。たとえば、以下いかのようなコードになります。 import openai openai.api_key = "sk-..." # APIキー completion = openai.ChatCompletion.create( model="gpt-3.5-turbo", messages=[{"role": "user", "content": "こんにちは!"}] ) print(complet

                                ChatGPT APIとWhisper APIで議事録文字起こしアプリを作り、Hugging Face Spacesで公開する | gihyo.jp
                              • 自動じどう文字もじこしサービスである、OpenAIの「Whisper API」とAWSの「Amazon Transcribe」の精度せいど比較ひかくしてみた | DevelopersIO

                                自動じどう文字もじこしサービスである、OpenAIの「Whisper API」とAWSの「Amazon Transcribe」の精度せいど比較ひかくしてみた はじめに 今回こんかいは、OpenAIのWhisper APIとAmazon Transcribeという2つの音声おんせい文字もじこしサービスをためし、それぞれの精度せいど比較ひかくしてみました。 Amazon Transcribeは、音声おんせいをテキストに変換へんかんする自動じどう音声おんせい認識にんしきサービスです。 ストリーミングとバッチ処理しょりのどちらでも文字もじこしが可能かのうです。 攻撃こうげきてき言葉ことば指定していすると、Amazon Transcribeがそれらの言葉ことば文字もじこしから自動的じどうてき削除さくじょする語彙ごいフィルタリングなどの機能きのうもあります。 Amazon Transcribeの詳細しょうさいは、下記かき記事きじをご参考さんこうください。 OpenAIには音声おんせいをテキストに変換へんかんする「Whisper」という音声おんせい認識にんしきモデルがあり、WhisperをAPIのかたち

                                  自動文字起こしサービスである、OpenAIの「Whisper API」とAWSの「Amazon Transcribe」の精度を比較してみた | DevelopersIO
                                • Introducing ChatGPT and Whisper APIs

                                  Developers can now integrate ChatGPT and Whisper models into their apps and products through our API. ChatGPT and Whisper models are now available on our API, giving developers access to cutting-edge language (not just chat!) and speech-to-text capabilities. Through a series of system-wide optimizations, we’ve achieved 90% cost reduction for ChatGPT since December; we’re now passing through those

                                    Introducing ChatGPT and Whisper APIs
                                  • 2022ねん深層しんそう学習がくしゅうハイライト - Qiita

                                    はじめに 2023ねんになってってしまいましたが、今年ことし深層しんそう学習がくしゅう個人こじんてきハイライトをまとめたいとおもいます。今回こんかい研究けんきゅう論文ろんぶん5ほん応用おうよう事例じれい4つを紹介しょうかいします。におもしろいトピックがあれば、ぜひコメントなどでおしえてください。 AIの研究けんきゅう動向どうこう関心かんしんのあるほうには、ステート・オブ・AIガイドの素晴すばらしい年間ねんかんレビューもおすすめします。また、わたし過去かこいた記事きじ(2021ねん、2020ねん、2019ねん)もよろしければごらんください。 * ほん記事きじは、わたしのブログにて英語えいごいた記事きじ翻訳ほんやくし、適宜てきぎ加筆かひつ修正しゅうせいしたものです。もと記事きじほう拡散かくさんいただけるとはげみになります。 ** 記事きじちゅう画像がぞうは、ことわりのないかぎ対象たいしょう論文ろんぶんからの引用いんようです。 研究けんきゅう論文ろんぶん Block-NeRF: Scalable Large Scene Neural View Synthesis 著者ちょしゃ: Matthew Tancik, Vincent Casser,

                                      2022年の深層学習ハイライト - Qiita
                                    • WhisperとChatGPTで文字もじこし | ドクセル

                                      やみのエンジニア/へんなデジカメ開発かいはつちゅう/ディープラーニング芸人げいにん/Raspberry Piとからあげ大好だいすき/はてなブログいてます

                                        WhisperとChatGPTで文字起こし | ドクセル
                                      • OpenAI API で提供ていきょうされている モデル まとめ|npaka

                                        1. OpenAI APIのモデル「OpenAI API」は、用途ようとおうじて「GPT-3.5」をはじめとする様々さまざまなモデル を提供ていきょうしています。 ・GPT-3.5 : 自然しぜん言語げんごとコードを理解りかいおよび生成せいせいする最新さいしんモデル。 ・DALL-E : 自然しぜん言語げんごから画像がぞう生成せいせい編集へんしゅうするモデル ・Whisper : 音声おんせいをテキストに変換へんかんするモデル ・Embeddings : み (ベクトル表現ひょうげん) を生成せいせいするモデル ・Codex : コードを理解りかいおよび生成せいせいするモデル ・Moderation : センシティブおよび 安全あんぜんでない文章ぶんしょう検出けんしゅつするモデル ・GPT-3 : 自然しぜん言語げんご理解りかいおよび生成せいせいするきゅうモデル 2. GPT-3.5「GPT-3.5」は、自然しぜん言語げんごとコードを理解りかいおよび生成せいせいする最新さいしんモデルです。もっと高性能こうせいのう費用ひようたい効果こうかたかいモデルは、チャットよう最適さいてきされていますが、既存きそんタスクにもてきしている「gpt-3.5-tu

                                          OpenAI API で提供されている モデル まとめ|npaka
                                        • writeout.ai

                                          Transcribe and translate any audio file. Upload your audio file and get a transcript in seconds. Writeout.ai is a free online transcription service.

                                            writeout.ai
                                          • 無料むりょうはじめるAmazon CodeWhisperer on VSCode(Github Copilotと同等どうとう性能せいのう?) - Qiita

                                            無料むりょうはじめるAmazon CodeWhisperer on VSCode(Github Copilotと同等どうとう性能せいのう?)AmazoncopilotCodeWhisperer 現在げんざいの AIを一言ひとこと説明せつめいすると・・・ フミコ・フミオさんはTwitterを使つかっています: 「ほぼ全員ぜんいんがご高齢こうれいしゃ会社かいしゃ上層じょうそうからの「対話たいわがたAI とはなにかその功罪こうざいについて簡潔かんけつかりやすく出来できたら一言ひとこと説明せつめいしろ」という難題なんだいにヤケクソで「ドラえもんです」とこたえたら「便利べんりだけど取扱とりあつかい注意ちゅういということだな」とほぼ正解せいかい認識にんしきをしてくれたので藤子とうこ・F・不二雄ふじお先生せんせい偉大いだいすぎる。」 / Twitter Github Copilot と Amazon CodeWhisperer の比較ひかく 現時点げんじてんでは Github Copilot のほう使つかいやすい。 単純たんじゅん機能きのうだとおなじくらいだが、 Github Copilot は、コマンドパレットがあるので、その

                                              無料で始めるAmazon CodeWhisperer on VSCode(Github Copilotと同等の性能?) - Qiita
                                            • OpenAIがリリースしたこう精度せいど音声おんせい認識にんしきモデル”Whisper”を使つかって、オンライン会議かいぎ音声おんせいこししてみた | DevelopersIO

                                              こんちには。 データアナリティクス事業じぎょう本部ほんぶ 機械きかい学習がくしゅうチームの中村なかむらです。 2022/09/22の夕方ゆうがたごろ、OpenAIが音声おんせい認識にんしきですごいものをしたらしいというニュースが社内しゃないのSlackをにぎわせていました。 個人こじんてきには、いくら認識にんしきすごいってっても、実際じっさい日本語にほんご微妙びみょうなんじゃないかな…?とおもっていたのですが… ですが… … … … おお!?(上記じょうきはGitHubにあるWER: Word Error Rateのグラフです) これは!? これは結構けっこうさげな数値すうちしている!?(たぶん) ってことでもと音声おんせいさんとしては、これはためすしかない!ということでうごかしてみました!(投稿とうこう翌日よくじつになってしまいましたが…) なお、ほん記事きじでは論文ろんぶん内容ないよう詳細しょうさいなどにはれませんのでご了承りょうしょうください。(後日ごじつできたらがんばります) いますぐ使つかいたいひといますぐ使つかいたいほうは、Hugging Faceでブラウザからこしをこころみ

                                                OpenAIがリリースした高精度な音声認識モデル”Whisper”を使って、オンライン会議の音声を書き起こししてみた | DevelopersIO
                                              • OpenAIのSpeech-To-Text AI「Whisper」をM1 Macでためしてみる

                                                OpenAIがSpeech-To-Text AIのWhisperを発表はっぴょうしました。Githubからpipでインストールすれば簡単かんたん使つかえます。わたしのM1 Max MacBook Proでも動作どうさしましたので、作業さぎょう内容ないよういておきます。 GitHub – openai/whisper: Robust Speech Recognition via Large-Scale Weak Supervision Robust Speech Recognition via Large-Scale Weak Supervision – GitHub – openai/whisper: Robust Speech Recognition via Large-Scale Weak Supervision Python仮想かそう環境かんきょうつくる Python自体じたいのインストールはすでわっているところからくことにします。わたし環境かんきょう

                                                  OpenAIのSpeech-To-Text AI「Whisper」をM1 Macで試してみる
                                                • 無料むりょうでOpenAIの「Whisper」を使つかって録音ろくおんファイルから音声おんせい認識にんしき文字もじおこしする方法ほうほうまとめ

                                                  画像がぞう生成せいせいAI「DALL・E2」や文章ぶんしょう生成せいせいAI「GPT-3」「InstructGPT」などを開発かいはつするAI研究けんきゅう団体だんたいのOpenAIが、2022ねん9がつ高性能こうせいのう文字もじこしAI「Whisper」を発表はっぴょうしました。オープンソースのWhisperはリポジトリが一般いっぱん公開こうかいされており、日本語にほんごにも対応たいおうしているとのことで、オンライン実行じっこう環境かんきょうのGoogle Colaboratory(Google Colab)やローカルのWindows環境かんきょう導入どうにゅうして使つかってみました。 Introducing Whisper https://openai.com/blog/whisper/ GitHub - openai/whisper https://github.com/openai/whisper ○目次もくじ ◆Hugging Faceの体験たいけんばん使つかってみる ◆Google Colabに導入どうにゅうして使つかってみる ◆Windows環境かんきょう導入どうにゅうしてみ

                                                    無料でOpenAIの「Whisper」を使って録音ファイルから音声認識で文字おこしする方法まとめ
                                                  • LISTEN

                                                    アート ビジネス コメディ 教育きょういく 小説しょうせつ 行政ぎょうせい 歴史れきし 健康けんこう/フィットネス キッズ/ファミリー レジャー 音楽おんがく ニュース 宗教しゅうきょう/スピリチュアル 科学かがく 社会しゃかい文化ぶんか スポーツ テクノロジー 事件じけん犯罪はんざい テレビ & 映画えいが $wire.selectEpisode(episodes[index].id) ); $watch('currentTime', time => { if (time > 0 && (Math.floor(time / 10) != Math.floor(lastPosition / 10))) { lastPosition = time; $wire.updatePosition(time); } }); "> { return fileType.startsWith(acceptedType); }); if (!matched) { valid = false; break;

                                                      LISTEN
                                                    • ReazonSpeech - Reazon Human Interaction Lab

                                                      ReazonSpeech¶ ReazonSpeechは、世界せかい最大さいだいのオープン日本語にほんご音声おんせいコーパスを構築こうちくするプロジェクトです。 日本語にほんご音声おんせい技術ぎじゅつ推進すいしん目的もくてきとして、35,000あいだ日本語にほんご音声おんせいコーパスを公開こうかいしています。 音声おんせい認識にんしきモデル・コーパス作成さくせいライブラリをオープンソースライセンスで配布はいふしています。

                                                      • superwhisperでの音声おんせい入力にゅうりょくため

                                                        superwhisperという、whisper.cppを使つかった音声おんせい入力にゅうりょくができるmacOSアプリケーションを最近さいきん使つかっています。 基本きほんてきにはggerganov/whisper.cppのモデルを使つかって、音声おんせい認識にんしきしながら文字もじ入力にゅうりょくができるアプリケーションです。 特徴とくちょう Whisperの認識にんしき精度せいどたかい かなりはやしゃべっても認識にんしきしてくれる 日本語にほんご認識にんしきしてくれるモデルがある 日本語にほんごしゃべって英語えいご翻訳ほんやくしてくれる機能きのうもある オフライン対応たいおう 有料ゆうりょう: サブスク と り の2種類しゅるいのプランがある 無料むりょうで15ぶんのトライアル、そのえらべるモデルが制限せいげんされる 公式こうしきサイトのデモをみると、かなりはやしゃべっても認識にんしきしてくれるのがわかります。 大抵たいていひとにとっては、多分たぶん文字もじ入力にゅうりょくするよりしゃべったほうがはやいぐらいの入力にゅうりょく速度そくどるとおもいます。 superwhisper 長文ちょうぶんはそこまで得意とくいじゃないけど、1ぎょうとか2ぎょうぐらいの文章ぶんしょうはかなり

                                                          superwhisperでの音声入力を試す
                                                        • OpenAI、「GPT-4」「DALL・E」「Whisper」などのAPIを一般いっぱん提供ていきょう

                                                          印刷いんさつする メールでおくる テキスト HTML 電子でんし書籍しょせき PDF ダウンロード テキスト 電子でんし書籍しょせき PDF クリップした記事きじをMyページからむことができます OpenAIは米国べいこく時間じかん7がつ6にち有料ゆうりょうばん「ChatGPT API」のぜんユーザーに「GPT-4」へのアクセスを提供ていきょうすると発表はっぴょうした。同社どうしゃは3がつにChatGPT APIをリリースし、6がつにアップデートを提供ていきょうしていた。また、「Completions API」のきゅうモデルを推奨すいしょう(deprecation)とする計画けいかく発表はっぴょうし、「Chat Completions API」への移行いこう推奨すいしょうするという。 同社どうしゃによると、GPT-4はもっと高機能こうきのうなモデルとなり、GPT-4を活用かつようした革新かくしんてき製品せいひんうごとにえている。6にちより、有料ゆうりょうばん支払しはら履歴りれきがある開発かいはつしゃは、8kのコンテキストちょうでGPT-4 APIを利用りようできる。あたらしい開発かいはつしゃには7がつまつまでにアクセスを提供ていきょうし、その

                                                            OpenAI、「GPT-4」「DALL・E」「Whisper」などのAPIを一般提供
                                                          • Whisper + GPT-3 で会議かいぎ音声おんせいからの議事ぎじろくし&サマリ自動じどう生成せいせいをやってみる! - Qiita

                                                            こんにちは!逆瀬川さかせがわ (https://twitter.com/gyakuse)です! 今日きょう議事ぎじろく音声おんせいからのしとサマリの自動じどう生成せいせいおこないます。 概要がいよう 会議かいぎ音声おんせい(wavとかmp3ファイル)からWhisperをもちいてしをおこない、GPT-3.5でサマリを自動じどう生成せいせいします。 会議かいぎ音声おんせいとしていますが、べつにどんな音声おんせいでも大丈夫だいじょうぶです。 Colab whisper.cppばん(処理しょり動画どうがびょうすう×10ばい程度ていど時間じかんがかかりますがGPU不要ふようです) whisper.fp16はん(処理しょり動画どうがびょうすう/4程度ていど時間じかんみますがGPU必須ひっすです) 使つかかた OpenAIのAPIキーをけ ランタイム > すべてのセルを実行じっこうから実行じっこうし、最初さいしょ処理しょりしたてくるファイル選択せんたく録音ろくおんファイルを選択せんたくします ひたすらちます 実装じっそう Whisperの軽量けいりょう Whisperの軽量けいりょうとしては、cpp実装じっそうのwhisper.cppがあります

                                                              Whisper + GPT-3 で会議音声からの議事録書き出し&サマリ自動生成をやってみる! - Qiita
                                                            • 話題わだい文字もじこしAI「Whisper」、ニュース記事きじげてためしたらおどろきの精度せいどだった

                                                              インタビューや会議かいぎさい発言はつげん内容ないようをメモしながら、あと間違まちがえないよう録音ろくおんもするひとすくなくないだろう。だが、録音ろくおんした音声おんせいいてテキストにこす作業さぎょうはかなりの手間てまがかかる。筆者ひっしゃ場合ばあいはききとりづらい箇所かしょかえ再生さいせいしたり、パソコンに文字もじ操作そうさおくれて音声おんせい再生さいせい一時いちじ停止ていししたりしているうちに、実際じっさい録音ろくおん時間じかんなんばいもかかってしまう。作業さぎょうわるころにはつかれてうんざりしていることもある。 筆者ひっしゃおなじように「ほねれる文字もじこし作業さぎょうなにとからくにこなしたい」とかんがえるひとは、よう東西とうざいわずおおいのかもしれない。最近さいきんはAI(人工じんこう知能ちのう)によって音声おんせい解析かいせきして自動的じどうてき文字もじこしするツールが国内外こくないがいえてきた。なかでもおおきな注目ちゅうもくあつめているのは、べいOpenAI(オープンAI)の音声おんせい認識にんしきAI「Whisper」だ。 同社どうしゃべいテスラ創業そうぎょうしゃのイーロン・マスクらが設立せつりつしたAIの研究けんきゅう開発かいはつ企業きぎょうで、2020ねん発表はっぴょうしたげん

                                                                話題の文字起こしAI「Whisper」、ニュース記事を読み上げて試したら驚きの精度だった
                                                              • Whisperで文字もじこしをした議事ぎじろく発話はつわしゃ名前なまえ自動的じどうてき判定はんていする! - Qiita

                                                                こんにちは!逆瀬川さかせがわ ( @gyakuse ) です! 今日きょう最近さいきんつくった議事ぎじろく文字もじこしアプリに話者わしゃ分離ぶんり機能きのうをくっつけたものをつくっていきたいとおもいます。 ChatGPT APIの使つかかた、Whisper APIの使つかかた、Hugging Face Spacesへのデプロイ方法ほうほうとうりたい場合ばあい以下いか記事きじをぜひ! できたもの openai_keyにOpenAIのAPIキーをれる メイン音声おんせいファイルに会話かいわ音声おんせい (wav, 25MB以内いない) をれる 話者わしゃ (1) 参考さんこう音声おんせいファイルに話者わしゃ (1) の参考さんこう音声おんせい (wav) をれる 話者わしゃ (1) の名前なまえれる 話者わしゃ (2) 参考さんこう音声おんせいファイルに話者わしゃ (1) の参考さんこう音声おんせい (wav) をれる 話者わしゃ (2) の名前なまえれる 上記じょうきおこなって送信そうしんボタンをすと処理しょり開始かいしされます。なお、参考さんこう音声おんせいは10びょう程度ていど大丈夫だいじょうぶです。実装じっそう全体ぜんたい以下いか確認かくにんできます。 話者わしゃ分離ぶんり (S

                                                                  Whisperで文字起こしをした議事録の発話者の名前を自動的に判定する! - Qiita
                                                                • ChatGPT, Python, Whisper APIを活用かつようし、動画どうがファイルから議事ぎじろく自動じどう生成せいせい - Qiita

                                                                  はじめに 現在げんざいのデジタル社会しゃかいでは、Teamsなどのオンライン会議かいぎ日常にちじょうてきおこなわれています。 しかし、その議事ぎじろくるのは容易よういではありません。そこで、OpenAIのChatGPTとWhisperを使つかって、動画どうがファイルから議事ぎじろく自動じどう生成せいせいする方法ほうほうをご紹介しょうかいします。 補足ほそく説明せつめい:ChatGPTについて ChatGPTは、OpenAIが開発かいはつした自然しぜん言語げんご処理しょりAIで、人間にんげん自然しぜん会話かいわすることが可能かのうです。GPT-3、GPT-4というだい規模きぼ言語げんごモデルをベースにしており、様々さまざま文脈ぶんみゃくでの文章ぶんしょう生成せいせい得意とくいです。 補足ほそく説明せつめい:Whisperについて Whisperは、OpenAIが開発かいはつした自動じどう音声おんせい認識にんしき(ASR)システムです。大量たいりょう音声おんせいとテキストデータで訓練くんれんされており、音声おんせいをテキストに変換へんかんするタスクを効率こうりつてきおこないます。 処理しょりながれ ここから、具体ぐたいてき動画どうがファイルから議事ぎじろく生成せいせいするための具体ぐたいてき手順てじゅん説明せつめいします。 1.

                                                                    ChatGPT, Python, Whisper APIを活用し、動画ファイルから議事録を自動生成 - Qiita
                                                                  • GitHub - openai/whisper: Robust Speech Recognition via Large-Scale Weak Supervision

                                                                    You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                                                                      GitHub - openai/whisper: Robust Speech Recognition via Large-Scale Weak Supervision
                                                                    • ChatGPT・Whisper・Otter・DeepLのすごい「英語えいごりょく」、海外かいがい取材しゅざい効果こうか絶大ぜつだいだった

                                                                      べいOpenAI(オープンAI)の「ChatGPT」をはじめとする高度こうど言語げんごAI(人工じんこう知能ちのう)が国内外こくないがいおおきな話題わだいとなっている。英語えいご日本語にほんご中国ちゅうごくなど言語げんごあやつり、ひとはなした言葉ことばをききとったり、こなれた文章ぶんしょういたり、翻訳ほんやくしたりする。ちかごろは毎日まいにちのようにテレビやインターネットでニュースをかけるほどだ。様々さまざま言語げんごAIをためしながら、自分じぶんなりの活用かつようほうさぐっている読者どくしゃほうすくなくないだろう。 筆者ひっしゃ最近さいきん取材しゅざい活動かつどうにChatGPTなどの言語げんごAIがどれだけ役立やくだつのかを検証けんしょうする機会きかいがあった。スペイン・バルセロナで2023ねん2がつ27にちから3がつ2にちまで開催かいさいされたモバイル業界ぎょうかい最大さいだいきゅう展示てんじかい「MWC Barcelona 2023」にはじめて参加さんかした。世界せかい202のくに地域ちいきから8まん8500にん以上いじょう参加さんかしたというどうイベントは、基本きほんてき英語えいご使つかわれる。カンファレンス、メディアけの展示てんじブースツアー、1たい1のインタビューの

                                                                        ChatGPT・Whisper・Otter・DeepLのすごい「英語力」、海外取材で効果絶大だった
                                                                      • iOSばん「OpenAI ChatGPT」アプリ、まずは米国べいこく公開こうかい 音声おんせい入力にゅうりょく可能かのう

                                                                        Webばん同様どうようにログインして使つかう。有料ゆうりょうばん「ChatGPT Plus」ユーザーであれば、Webばん同様どうようにGPT-4へのアクセスやしん機能きのう早期そうき利用りようなどが可能かのうだ。 また、昨年さくねん9がつ発表はっぴょうしたオープンソースの音声おんせいテキスト変換へんかんAI「Whisper」により、音声おんせいでのプロンプト入力にゅうりょく可能かのうだ。 べいMicrosoftは2がつに「あたらしいBing」のモバイルアプリばんをiOSおよびAndroidけにリリースした。こちらはすで日本にっぽんでも利用りよう可能かのうで、日本語にほんごでの音声おんせい入力にゅうりょくもできる。 現在げんざいApp Storeで「ChatGPT」を検索けんさくすると、OpenAIのロゴにたロゴをかんした類似るいじアプリが多数たすう表示ひょうじされる。OpenAI ChatGPTは日本にっぽんではまだ公開こうかいされていないので、注意ちゅうい必要ひつようだ。 関連かんれん記事きじ ChatGPT Plusのプラグインを使つかってみた 「べログ」連携れんけい実在じつざい店舗てんぽ案内あんない可能かのうに OpenAIは「ChatGPT Plus」のサー

                                                                          iOS版「OpenAI ChatGPT」アプリ、まずは米国で公開 音声入力も可能
                                                                        • whisper.cppのCore MLばんをM1 MacBook Proでうごかす

                                                                          OpenAIの音声おんせい認識にんしきモデルであるWhisperの高速こうそく推論すいろんばんであるwhisper.cppが、いつのまにか [1] Core ML対応たいおうしていた。 Core ML対応たいおうしたということは、macOS/iOSデバイス(Mac, iPhone, etc...)に搭載とうさいされているNeural Engine、GPUを利用りようして推論すいろん処理しょりおこなうようになった、ということを意味いみする。[2] さっそくREADMEの手順てじゅんをなぞりつつ手元てもとのMBPでうごかしてみたメモ。 なお、実行じっこう環境かんきょう以下いかとおり: MacBook Pro M1 Max 64GB macOS Ventura 13.3.1 Core MLモデルの生成せいせい手順てじゅん 依存いぞんパッケージのインストール whisper.cppのCore MLモデルの作成さくせい必要ひつようなパッケージをインストールする。

                                                                            whisper.cppのCore ML版をM1 MacBook Proで動かす
                                                                          • OpenAI Whisper に追加ついか学習がくしゅうをさせるこころみ | IIJ Engineers Blog

                                                                            地方ちほう拠点きょてんひとつ、九州きゅうしゅう支社ししゃ所属しょぞくしています。サーバ・ストレージを中心ちゅうしんとしたSI業務ぎょうむたずさわってましたが、現在げんざい技術ぎじゅつ探索たんさく深堀ふかほり業務ぎょうむ中心ちゅうしん対応たいおうしています。 2018ねん難病なんびょうわずらったことにより、定期ていきてき入退院にゅうたいいんかえしつつ、2023ねんには男性だんせい更年期こうねんき障害しょうがい発症はっしょうをきっかけに、トランスジェンダーとしてのみちあゆはじめてます。 【IIJ 2022 TECHアドベントカレンダー 12/8()の記事きじです】 Whisperの追加ついか学習がくしゅういどむ2022ねんふゆ 2022ねんアドベントカレンダー企画きかくだそうです。 いかがおごしでしょうか。 わたしはもう興味きょうみくものに没頭ぼっとうするしかたのしみがないもんで、PCにかってぼんやり面白おもしろいネタはないかなーとさが日々ひびです。 最近さいきんはすっかりディープラーニングにズブズブで、とうとう数式すうしきかくのが面倒めんどうなあまり手書てが入力にゅうりょくのためのペンタブレットをいました。てへ。 今回こんかいは9月から10がつにかけてStabl

                                                                              OpenAI Whisper に追加学習をさせる試み | IIJ Engineers Blog
                                                                            • Amazon Connectでおわせ内容ないようをWhisper APIで文字もじこしし、ChatGPTで要約ようやくして音声おんせい出力しゅつりょくしてみた(いち対応たいおう無人むじん) | DevelopersIO

                                                                              Amazon Connectでおわせ内容ないようをWhisper APIで文字もじこしし、ChatGPTで要約ようやくして音声おんせい出力しゅつりょくしてみた(いち対応たいおう無人むじん) はじめに Amazon Connectを使用しようして、おわせ内容ないようをOpenAIのWhisper APIで文字もじこしとChatGPTで要約ようやくし、通話つうわちゅう音声おんせい出力しゅつりょくする方法ほうほうをまとめました。 Connectで無人むじん対応たいおう場合ばあい顧客こきゃくからの発話はつわをききと方法ほうほうとしては、チャットボットサービスであるAmazon Lexもしくは、Kinesis Video Stream(KVS)で音声おんせいのストリーミングなどがあります。 Amazon Lexを利用りようする場合ばあいは、1に15びょう以上いじょうはききとることができないてん文字もじこしにはAmazon Transcribeを利用りようする制約せいやくがあります。 今回こんかいは、文字もじこしにWhisper APIを利用りようし、ChatGPTで要約ようやくした内容ないようをConne

                                                                                Amazon Connectでお問い合わせ内容をWhisper APIで文字起こしし、ChatGPTで要約して音声出力してみた(一次対応の無人化) | DevelopersIO
                                                                              • 生成せいせいAIと音声おんせい認識にんしきわせて会議かいぎアシスタントツールをつくったら生産せいさんせい大幅おおはば向上こうじょうしたはなし

                                                                                株式会社かぶしきがいしゃクラウドネイティブは、Azure OpenAIで組織そしき専用せんようのChatGPTの構築こうちく支援しえんするサービスを展開てんかいしています。ChatGPTとAzure AD OpenAI Serviceのみや事例じれい支援しえん… IDチームの前田まえだです。今日きょう生成せいせいAI(ChatGPT)と音声おんせい認識にんしきモデル(Whisper)を利用りようした会議かいぎアシスタントツールにかんする投稿とうこうになります。 (追記ついき) つくったツールはGitHubじょう公開こうかいしており、Dockerを利用りようしてすぐにためせるようになってます。 https://github.com/cloudnative-co/mtg-ai-assistant 2023ねん8がつ30にち現在げんざいAzure OpenAIにてWhisperが利用りよう出来できていないため、OpenAI Whisper APIを利用りようした試験しけん段階だんかいのものになります。近日きんじつちゅうにAzure OpenAIにてWhisperが利用りよう出来できるとアナウ

                                                                                  生成AIと音声認識を組み合わせて会議アシスタントツールを作ったら生産性が大幅に向上した話
                                                                                • ジェネレーティブAIで「文字もじこし」をリライトさせるとどうなるのか。Easy-Peasy.AIを日本語にほんご使つかってみた(西田にしだそう千佳ちか) | テクノエッジ TechnoEdge

                                                                                  1971ねん福井ふくいけんまれ。得意とくいジャンルは、パソコン・デジタルAV・家電かでん、ネットワーク関連かんれんなど「電気でんきかデータがながれるもの全般ぜんぱん」。おもに、取材しゅざい記事きじ個人向こじんむ解説かいせつ記事きじ担当たんとう音声おんせいこしはライターにとってゆめ技術ぎじゅつだ。そのまま原稿げんこうにできるわけではないが、インタビュー原稿げんこう取材しゅざい記事きじ執筆しっぴつするじょうでの手間てま劇的げきてきる。筆者ひっしゃはもうずっとむかしから、こしけい技術ぎじゅつるたびに試行錯誤しこうさくごかえしてきた。 そんななかに、ちょっとびっくりするようなサービスがあらわれた。正確せいかくにいえば「使つかってみたらびっくりするようなものだった」というのがただしいだろうか。 それはいわゆるジェネレーティブAIサービスである「Easy-Peasy.AI」だ。このうち、AIによる音声おんせいこしサービス「AI Transcription」を日本語にほんご使つかってみた。 結果けっかとして、「非常ひじょう使つかえるが、面白おもしろ性質せいしつがある」こともわかってきた。現在げんざいのジェネレーテ

                                                                                    ジェネレーティブAIで「文字起こし」をリライトさせるとどうなるのか。Easy-Peasy.AIを日本語で使ってみた(西田宗千佳) | テクノエッジ TechnoEdge

                                                                                  新着しんちゃく記事きじ