カテゴリー別アーカイブ: 未分類

Ubuntu 24.04で動画の文字起こし

ChatGPT o4 に、動画をアップロードして、文字起こしをしようとしたら

pythonで、行うようにと、ソースプログラムを表示してくれたのでやってみた

早速、Ubuntu 24.04のPCでやってみよう

まず、pythonなので、仮想空間を作る

python3 -V

Python 3.12.3

バージョンは 3.12.3

仮想空間を作るために

python3 -m venv voice

source voice/bin/activate
bash: voice/bin/activate: そのようなファイルやディレクトリはありません

メッセージをみたら、エラーを出していた

apt install python3.12-venv

インストールが必要

sudo apt install python3.12-venv

再度

python3 -m venv voice

source voice/bin/activate

こんどは、入れた

GPTが教えてくれた、コマンドで

pip install moviepy speechrecognition pydub
Collecting moviepy

で、必要なライブラリーをインストール

プログラムをmoji.pyで作っておいて

python3 moji.py

で、実行

エラーを表示、mp3は、だめで、wavとのこと

Audacityを使って、wavに変換

実行したら、時間がかかったが、画面に表示した

python3 moji.py > kekka.txt

で、ファイルに落ちた

案外精度はよさそうである

プログラムは、以下となっている

import speech_recognition as sr

recognizer = sr.Recognizer()
audio = sr.AudioFile(“extracted_audio.wav”)

with audio as source:
recognizer.adjust_for_ambient_noise(source)
audio_data = recognizer.record(source)

try:
text = recognizer.recognize_google(audio_data, language=’ja-JP’)
print(text)
except sr.UnknownValueError:
print(“音声が不明瞭で理解できませんでした。”)
except sr.RequestError as e:
print(f”リクエストに失敗しました; {e}”)

活用していってみよう

Ununtu24.04で、スタバのWifiに接続

スタバのwifiに接続しようとしたらなかなか接続ができなかった

あらかじめ、ブラウザ(Chrome)を、立ち上げてから

ネットの接続を切り替え、画面上部に接続のメッセージを

クリックしたところ、接続確認の画面になった

ubuntu 24.04にHeidSQLをインストール

exeをダウンロード

ttps://forest.watch.impress.co.jp/library/software/heidisql/

から、



HeidiSQL_12.8.0.6908_Setup.exe

端末

から、wineをインストール

$ sudo apt install wine

$wine –version

wine-9.0 (Ubuntu 9.0~repack-4build3)

$wine HeidiSQL_12.8.0.6908_Setup.exe



指示に従い apt-get install wine32:i386



rootでないといけないのかな?

$sudo apt-get install wine32:i386

やはり上手くいかない

sudo apt-get install wine32

以下のパッケージには満たせない依存関係があります:
libgphoto2-6t64:i386 : 依存: libgd3:i386 (>= 2.1.0~alpha~) しかし、インストールされようとしていません

ttps://www.ohsan.info/2017/08/blog-post_21.html

ttps://qiita.com/nanbuwks/items/a18dd35ad83ab70879b4

を、参考にして

$sudo apt install –install-recommends libgd3:i386

$sudo apt-get install wine32

無事通過

$wine HeidiSQL_12.8.0.6908_Setup.exe

エラー

wine: could not load kernel32.dll, status c0000135

ttps://frees.jp/2023/04/10/wine-could-not-load-kernel32-dll-status-c0000135%E3%80%80%E3%81%8C%E8%A1%A8%E7%A4%BA%E3%81%95%E3%82%8C%E3%82%8B/#google_vignette

より

$rm -rf ~/.wine

$wine HeidiSQL_12.8.0.6908_Setup.exe

一応、Wineのフォルダーに、複写して、そこで起動

にて、起動できた








文字化けするが、想像力で進んで行く

インストールできたので

起動してみると、やはり文字化け

対策しないと行けない

ttps://symfoware.blog.fc2.com/blog-entry-2228.html

$ sudo apt install -y winetricks
$ winetricks

で、対策できそう

再度実行したが、やはり、豆腐のまま

一応、電源を切って、再鼓動したら、文字化け解消

HeidiSQLも起動できた

Ubuntu 24.04 テキストエディタの文字入力が繰り返してしまう

Ubuntu 24.04の

標準のテキストエディタで、漢字変換した内容が残ってしまう

画面表示をX-Windowに切り替えたためなのか

対策がわからず、当面、別のエディタを使うことにした

現象は、変換した文字が残ってします

こんな感じです

不具合のある標準のエディタは

The GNOME Project

との事





他の、エディアがないか調べたら

gedit

が、あったので、アプリケーションセンターから

インストールしたら、今度は、文字変換が上手く行った



Ubuntu 24.04 にVOICEVOXをインストール

ttps://voicevox.hiroshiba.jp/product/aoyama_ryusei/

から、アプリをダウンロード

cd /home/ubuntu/ダウンロード/

./VOICEVOX.Installer.0.19.2.Linux.sh

bash: ./VOICEVOX.Installer.0.19.2.Linux.sh: 許可がありません

権限がないので、エラーになる

■権限を付与

chmod +x ./VOICEVOX.Installer.0.19.2.Linux.sh

./VOICEVOX.Installer.0.19.2.Linux.sh
+-+-+-+-+-+-+-+-+
|V|O|I|C|E|V|O|X|
+-+-+-+-+-+-+-+-+-+-+-+-+-+
|I|n|s|t|a|l|l|e|r|
+-+-+-+-+-+-+-+-+-+-+-+-+-+
|f|o|r| |L|i|n|u|x|
+-+-+-+-+-+-+-+-+-+
[+] Checking installer prerequisites…
[!] Command ‘7z’, ‘7zr’ or ‘7za’ not found

Required to extract compressed files

Ubuntu/Debian:
sudo apt install p7zip

■p7zipがない、支持に従い、インストール

sudo apt install p7zip

./VOICEVOX.Installer.0.19.2.Linux.sh

curl: (23) Failure writing output to destination

■curlが必要のようなので、インストール

sudo apt install curl

./VOICEVOX.Installer.0.19.2.Linux.sh

All done! VOICEVOX 0.19.2 has been installed under ‘/home/ubuntu/.voicevox’.

うまく行ったようである

ショートカットに追加して、起動してみる

アイコンをクリックしても起動しない

直接起動してみる

cd

./.voicevox/VOICEVOX.AppImage

やはり、だめ

ttps://github.com/VOICEVOX/voicevox/issues/2071

を、参考にして

■ 起動引数--no-sandbox

./.voicevox/VOICEVOX.AppImage –no-sandbox

で、起動した

それでは、ショートカットを作ってみる

ttps://lunaris-code.com/pc/64/

を、参考に

Desktopは、カタカナなので
デスクトップで

cd

cd ~/デスクトップ

mkdir test-a/
nano test-a/test-a.sh

gnome-terminal — bash -c “echo ‘シェルスクリプト実効完了!’; bash”

Ctr+OからEnter、書き込み Ctr+Xで終了

権限を付与

chmod 774 test-a/test-a.sh

nano test-a.desktop

(cd ~/デスクトップ にて)

以下を参考に

[Desktop Entry]
Encoding=UTF-8
Type=Application
Name=test-a
Exec=/home/{user}/Desktop/test-a/test-a.sh
Icon=/home/{user}/Desktop/icon.png

{user}
は、ubuntuで
Desktopのフォルダーがカタカナ
デスクトップなので、変更

以下を作成

[Desktop Entry]
Encoding=UTF-8
Type=Application
Name=test-a
Exec=/home/ubuntu/デスクトップ/test-a/test-a.sh
Icon=/home/ubuntu/デスクトップ/icon.png

Ctr+OからEnter、書き込み Ctr+Xで終了

/home/ubuntu/デスクトップ/icon.png

を作成しておく

スクリーンショットで画像をコピーして
Gimpを開いて、
ファイル>画像生成>クリップボードから
ファイル>名前をつけて保存
/home/ubuntu/デスクトップ/icon.png
にて、保存

gio set test-a.desktop metadata::trusted true
chmod 774 test-a.desktop

デスクトップ画面上にある
test-a.desktop
をクリック(ダブルクリック)

画面が表示されたらOK

nano test-a/test-a.sh
にて
gnome-terminal — bash -c “echo ‘シェルスクリプト実効完了!’; bash”

./.voicevox/VOICEVOX.AppImage –no-sandbox

に、変更してみる

再度、Desktopのtest-aをダブルクリック

無事、Ubuntu 24.04で、VOICEVOXが起動した

test-aを、voicevoxに変更して

作り直してみよう

audacityで2倍速の音源を作成

動画などの情報を、音声にして、日頃勉強に活用したい場合がある

また、効率を上げるために、2倍速の音源があると役に立つ

audacityを利用すると、動画ファイルから、音源の抽出と

2倍速への変更、音声ファイル(MP3)への書き出しが可能である

手順は以下となります。

1,動画ファイルなどの音源を読み込む
 Audacityを立ち上げ、ファイルをドラッグ&ドロップにより読み込まれる
2,全てを選択(Ctr+A)
3,2倍に変更

「エフェクト」>「テンポ変更」>変更率「100」>「OK」



4,ファイルに書き出し
「ファイル」>別名で書き出し>MP3として書き出し>保存>「OK」