スキップしてメイン コンテンツに移動

CapCap V0.9.2.5 リリース

CapCapのV0.9.2.5をリリース

主な変更内容

  • 段落検出機能を追加
  • 字幕モードの名称を変更(Readability -> Text, Layout -> Item)

段落検出

テキストの行同士の距離をもとに段落を検出することが出来るようになりました。
段落の検出および段落間への空行挿入が行なえます。

これまではテキストをひと繋がりの文章として認識していましたが、段落ごとに分離されることで可読性の向上が見込めます。

段落検出(左:原文、右:字幕)


文章に対して段落が多い場合や段落が2行からなる場合などには精度が落ちる傾向にあります。また実験的機能の側面があるため問題点等あればご報告いただけると助かります。

DLページ:Home

コメント

  1. KoeMill のコメント欄が無かったのでここに書き込ませて頂きます。KoeMill は Whisper を install する手間が不要の素晴らしいソフトでありがたく使わせて貰っています。一点だけ、些細な問題がありました。tiny, base のモデルは正常にソフト内から download できましたが small 以上は download が完了しないようです。数度試して同じ結果でした。私は download 先のリンクを辿って https://github.com/ggerganov/whisper.cpp/tree/master/models から download-ggml-dmode.sh で small, medium を download して KoeMillのディレクトリに入れ、どちらの model でも正常に KoeMill による文字起こしが成功しています。些細なことですが一応、報告させて頂きます。

    大変、役に立つツールを公開してくださり、感謝いたします。

    返信削除
  2. KoeMillのご利用ありがとうございます。開発したソフトがお役に立てていること、またご意見伺えたこと嬉しく思います。

    small以上でdownloadが完了しないとのこと、ご迷惑をおかけしました。こちらでも時間帯によるのか原因については不明ですがダウンロードが断続的なものとなり非常に時間がかかる現象を確認しております。
    また、ご報告頂いたようにソフト内からのダウンロードだけでなくhttps://huggingface.co/ggerganov/whisper.cpp/tree/mainなどからモデルを直接ダウンロードしKoeMillのディレクトリに配置いただくことでもご利用いただけます。

    ご報告頂いたこと重ねてお礼申し上げます。

    返信削除

コメントを投稿

このブログの人気の投稿

KoeMill V.0.9.0.0 リリース

KoeMillのV.0.9.0.0をリリース KoeMillは、音声認識による文字起こしを行うソフトウェアです。音声認識モデルにはWhisperが採用されており動画や音声から自動的に高品質な文字起こしができるため、煩雑な手作業を省くことができます。 オフラインで動作するため、ネットワークの遅延などによる遅れやプライバシーに関する懸念もありません。また、GPUを利用することで高速な処理を実現します。 ダウンロードページ

CapCap V.0.9.2.7 リリース

CapCapのV.0.9.2.7をリリース 主な変更内容 HTTP POST設定でヘッダの設定に対応 HTTP POST設定でJSONのオブジェクトおよび配列に対応 HTTP POST設定を大項目ごとに折りたためる機能に対応 サンプルプリセット(ChatGPT API)を追加 プリセット複製時に複製先の変更が複製元に及んでいた不具合を修正 HTTP POST設定 新たにリクエストヘッダを設定できるようになりました。これによりAuthorizationによる認証などヘッダが必要なAPIにも対応できるようになりました。合わせて、これまで設定することが出来なかったJSON ObjectおよびArrayについても設定できるようになりました。 ChatGPT APIについて サンプルプリセットを追加しました。HTTP POSTのヘッダおよびJSON ArrayとObjectに対応したため、その対応例となります。 継続的に使おうとすると費用が発生することになるので、無料枠が残っている間に遊んでもらえると幸いです。 DLページ: Home