CapCapのV0.9.2.5をリリース
主な変更内容
- 段落検出機能を追加
- 字幕モードの名称を変更(Readability -> Text, Layout -> Item)
段落検出
テキストの行同士の距離をもとに段落を検出することが出来るようになりました。
段落の検出および段落間への空行挿入が行なえます。
これまではテキストをひと繋がりの文章として認識していましたが、段落ごとに分離されることで可読性の向上が見込めます。
文章に対して段落が多い場合や段落が2行からなる場合などには精度が落ちる傾向にあります。また実験的機能の側面があるため問題点等あればご報告いただけると助かります。
DLページ:Home
KoeMill のコメント欄が無かったのでここに書き込ませて頂きます。KoeMill は Whisper を install する手間が不要の素晴らしいソフトでありがたく使わせて貰っています。一点だけ、些細な問題がありました。tiny, base のモデルは正常にソフト内から download できましたが small 以上は download が完了しないようです。数度試して同じ結果でした。私は download 先のリンクを辿って https://github.com/ggerganov/whisper.cpp/tree/master/models から download-ggml-dmode.sh で small, medium を download して KoeMillのディレクトリに入れ、どちらの model でも正常に KoeMill による文字起こしが成功しています。些細なことですが一応、報告させて頂きます。
返信削除大変、役に立つツールを公開してくださり、感謝いたします。
KoeMillのご利用ありがとうございます。開発したソフトがお役に立てていること、またご意見伺えたこと嬉しく思います。
返信削除small以上でdownloadが完了しないとのこと、ご迷惑をおかけしました。こちらでも時間帯によるのか原因については不明ですがダウンロードが断続的なものとなり非常に時間がかかる現象を確認しております。
また、ご報告頂いたようにソフト内からのダウンロードだけでなくhttps://huggingface.co/ggerganov/whisper.cpp/tree/mainなどからモデルを直接ダウンロードしKoeMillのディレクトリに配置いただくことでもご利用いただけます。
ご報告頂いたこと重ねてお礼申し上げます。