ダウンロードしたNakkaのHTMLファイルをテキストに変換したい
(Llama-indexに食わせるため)
以下でできた
stackoverflow.com
textutil -convert txt *.html
ダウンロードしたNakkaのHTMLファイルをテキストに変換したい
(Llama-indexに食わせるため)
以下でできた
stackoverflow.com
textutil -convert txt *.html