ポッドキャストも作れる！Difyのファイルアップロード機能が便利なので詳しく解説してみた

にゃんたのAIチャンネル

Додати в
- Мій плейлист
- Переглянути пізніше
Поділитися

Поділитися

Вставка

Розмір відео:

Показувати елементи керування програвачем

Автоматичне відтворення

Автоповтор

Опубліковано 28 лис 2024

КОМЕНТАРІ • 23

@kamoyan55 5 днів тому ⁺³
タイムリーかつ、有用な情報ありがとうございます。いつも、勉強させてもらって、感謝です！
@aivtuber2866 5 днів тому ⁺¹
コメントありがとうございます！
中々マニアックかな･･･と思っていたのですが
そう言っていただけて良かったです😊
@松井弘道 4 дні тому ⁺²
論文のpdfを入力してpodcast を作りました。キーポイントを対話していて、わかりやすい。👍
@aivtuber2866 4 дні тому ⁺¹
早速試されたのですね･･･！
podcastちゃんとそれっぽくなりますよね😆
@salmon54561 4 дні тому ⁺³
多ファイル対応のテキスト抽出ツールと、リスト処理機能は便利そうですね。ポッドキャスト読み上げ機能はすごくピンポイントな気がしますが、英語圏ではそういうのが人気なのかな
@aivtuber2866 4 дні тому ⁺¹
ファイル処理系の機能は色々な場面で使えそうですよね！😊
NotebookLMに入るくらいなので
英語圏だとポッドキャスト需要あるのかもですね･･･！🤔
@ayasato-t3x 4 дні тому ⁺²
Difyの動画待ってました！いつも有益な情報をありがとうございます！
質問なのですが、テキスト抽出の所で仰っている「料金がかかる」はLLM側の入力トークンのことでしょうか？Difyに限らず、生成AI関連のツールは利用料金の見通しに難儀します…
@aivtuber2866 4 дні тому ⁺¹
ありがとうございます！
Difyの動画喜んでもらえて作って良かったです！
料金に関してはLLM側の入力トークンの話ですね！
PDFの文章全部入れちゃうとRAGと比べるとコスト高くなっちゃうので･･･💰
@T.S-i1g День тому ⁺²
ありがとうございます。動画興味深く拝見しました。
早速NotebookLM by Dify.AIを試したのですが、最後のPodcast audio generatorの処理で「Run failed: None is not a valid FileType」が発生して音声ファイルを生成できませんでした。こんな事象は発生しなかったでしょうか？
@MS-xi3oh День тому ⁺²
にゃんたさんいつも動画ありがとうございます！
T.S-i1gさんありがとうございます。、私も同様です。まず最初、PDFサイズが大きすぎて、claude api側で529Error overloadが出たので、極力PDFfileサイズを小さく文章量も少なくしたところ、今度はおなじNone is not..のエラーとなりました。そこで、原因箇所を特定するべく、プレビューにおいて処理を試し、エラーを吐くワークフロー処理から→「!」の項目→「ログを表示」で確認したところ、podcastAudioGeneratorであることがわかりました。ログをGPTにかけて原因箇所をきくと
・sys.filesが空で
ノードが期待する形式のファイルが正しく渡されてないんじゃない？
と言われたのですが、dify初心者なのでよくわからず、一旦ここで断念しています。
[追記]
気づいた点は、テンプレを作成時には、WAITINGノードに
/TEMPLATE CONVERSION
output
String
の出力?がないことでした。にゃんたさんの動画内ではありました。
そこで、/をいれて上記の値を次のノードに引き渡すように指定したのち、再度かけましたが同じ結果に。
また解決策がわかれば書きます。
@aivtuber2866 День тому ⁺²
コメントありがとうございます！
私が試していた時は大丈夫だったのですが、
現在のバージョンだと発生するバグのようですね･･･！
github.com/langgenius/dify/issues/11184
次のバージョンで改善されるということでした🤔
@前田陽造 2 дні тому ⁺¹
有用な情報ですね。ただ、RAG（ナレッジ）との差がよくわかりませんね。長い文章とそうではない場合に分けて使うということなんですかね。RAGの場合は、質問と類似した文章を検索し、それを質問とともにAIに投げるはずですが、ファイルアップロードの場合の仕組みはどうなっているのでしょうか？使い方的には、大量の文章の中から必要な文章を検索してもらい、そのファイルをさらにファイルアップロードを使い要約してもらうなどの２段階的な使い方になるのかな。
@aivtuber2866 2 дні тому ⁺¹
ありがとうございます！
今回紹介したものは、プロンプトの中に全て文章を埋め込んでいますね！
精度に関しては埋め込んだ方が良いですが、コストに関してはRAGの方が良いというところで
ユースケースに応じて使い分けできると良いかもしれませんね🤔
@koara5867 5 днів тому ⁺³
色々使えますよね。課題はイメージPDF（テキストが画像だけで埋め込まれていないPDF）のOCR処理を途中で入れるのが難しいところでしょうか
@aivtuber2866 5 днів тому ⁺¹
地味なんですが、仕事で使おうとしたら嬉しい機能ですよね･･･！
そうですね！Claudeの最新PDF読み込みAPIが使えるようになったら
そこらへんが解決できるかもですが、現状だとPDFの画像処理が難しいですよね🤔
@AaA-cr9nl 2 дні тому ⁺¹
Whisper v4って出そうですか？
そろそろ1年
@aivtuber2866 2 дні тому ⁺¹
Whisper v4出て欲しいですね･･･！
ただOpenAIは音声入力だけではなくて
音声入力もできるマルチモーダルなモデルの開発を
優先度高くやってそうな感じもしますよね🤔

Наступне

Автоматичне відтворення