Розмір відео: 1280 X 720853 X 480640 X 360
Показувати елементи керування програвачем
Автоматичне відтворення
Автоповтор
タイムリーかつ、有用な情報ありがとうございます。いつも、勉強させてもらって、感謝です!
コメントありがとうございます!中々マニアックかな・・・と思っていたのですがそう言っていただけて良かったです😊
論文のpdfを入力してpodcast を作りました。キーポイントを対話していて、わかりやすい。👍
早速試されたのですね・・・!podcastちゃんとそれっぽくなりますよね😆
多ファイル対応のテキスト抽出ツールと、リスト処理機能は便利そうですね。ポッドキャスト読み上げ機能はすごくピンポイントな気がしますが、英語圏ではそういうのが人気なのかな
ファイル処理系の機能は色々な場面で使えそうですよね!😊NotebookLMに入るくらいなので英語圏だとポッドキャスト需要あるのかもですね・・・!🤔
Difyの動画待ってました!いつも有益な情報をありがとうございます!質問なのですが、テキスト抽出の所で仰っている「料金がかかる」はLLM側の入力トークンのことでしょうか?Difyに限らず、生成AI関連のツールは利用料金の見通しに難儀します…
ありがとうございます!Difyの動画喜んでもらえて作って良かったです!料金に関してはLLM側の入力トークンの話ですね!PDFの文章全部入れちゃうとRAGと比べるとコスト高くなっちゃうので・・・💰
ありがとうございます。動画興味深く拝見しました。早速NotebookLM by Dify.AIを試したのですが、最後のPodcast audio generatorの処理で「Run failed: None is not a valid FileType」が発生して音声ファイルを生成できませんでした。こんな事象は発生しなかったでしょうか?
にゃんたさんいつも動画ありがとうございます!T.S-i1gさんありがとうございます。、 私も同様です。まず最初、PDFサイズが大きすぎて、claude api側で529Error overloadが出たので、極力PDFfileサイズを小さく文章量も少なくしたところ、今度はおなじNone is not..のエラーとなりました。そこで、原因箇所を特定するべく、プレビューにおいて処理を試し、エラーを吐くワークフロー処理から→「!」の項目→「ログを表示」で確認したところ、podcastAudioGeneratorであることがわかりました。ログをGPTにかけて原因箇所をきくと・sys.filesが空でノードが期待する形式のファイルが正しく渡されてないんじゃない?と言われたのですが、dify初心者なのでよくわからず、一旦ここで断念しています。[追記]気づいた点は、テンプレを作成時には、WAITINGノードに/TEMPLATE CONVERSIONoutputStringの出力?がないことでした。にゃんたさんの動画内ではありました。そこで、/をいれて上記の値を次のノードに引き渡すように指定したのち、再度かけましたが同じ結果に。また解決策がわかれば書きます。
コメントありがとうございます!私が試していた時は大丈夫だったのですが、現在のバージョンだと発生するバグのようですね・・・!github.com/langgenius/dify/issues/11184次のバージョンで改善されるということでした🤔
有用な情報ですね。ただ、RAG(ナレッジ)との差がよくわかりませんね。長い文章とそうではない場合に分けて使うということなんですかね。RAGの場合は、質問と類似した文章を検索し、それを質問とともにAIに投げるはずですが、ファイルアップロードの場合の仕組みはどうなっているのでしょうか?使い方的には、大量の文章の中から必要な文章を検索してもらい、そのファイルをさらにファイルアップロードを使い要約してもらうなどの2段階的な使い方になるのかな。
ありがとうございます!今回紹介したものは、プロンプトの中に全て文章を埋め込んでいますね!精度に関しては埋め込んだ方が良いですが、コストに関してはRAGの方が良いというところでユースケースに応じて使い分けできると良いかもしれませんね🤔
色々使えますよね。課題はイメージPDF(テキストが画像だけで埋め込まれていないPDF)のOCR処理を途中で入れるのが難しいところでしょうか
地味なんですが、仕事で使おうとしたら嬉しい機能ですよね・・・!そうですね!Claudeの最新PDF読み込みAPIが使えるようになったらそこらへんが解決できるかもですが、現状だとPDFの画像処理が難しいですよね🤔
Whisper v4って出そうですか?そろそろ1年
Whisper v4出て欲しいですね・・・!ただOpenAIは音声入力だけではなくて音声入力もできるマルチモーダルなモデルの開発を優先度高くやってそうな感じもしますよね🤔
タイムリーかつ、有用な情報ありがとうございます。いつも、勉強させてもらって、感謝です!
コメントありがとうございます!
中々マニアックかな・・・と思っていたのですが
そう言っていただけて良かったです😊
論文のpdfを入力してpodcast を作りました。キーポイントを対話していて、わかりやすい。👍
早速試されたのですね・・・!
podcastちゃんとそれっぽくなりますよね😆
多ファイル対応のテキスト抽出ツールと、リスト処理機能は便利そうですね。ポッドキャスト読み上げ機能はすごくピンポイントな気がしますが、英語圏ではそういうのが人気なのかな
ファイル処理系の機能は色々な場面で使えそうですよね!😊
NotebookLMに入るくらいなので
英語圏だとポッドキャスト需要あるのかもですね・・・!🤔
Difyの動画待ってました!いつも有益な情報をありがとうございます!
質問なのですが、テキスト抽出の所で仰っている「料金がかかる」はLLM側の入力トークンのことでしょうか?Difyに限らず、生成AI関連のツールは利用料金の見通しに難儀します…
ありがとうございます!
Difyの動画喜んでもらえて作って良かったです!
料金に関してはLLM側の入力トークンの話ですね!
PDFの文章全部入れちゃうとRAGと比べるとコスト高くなっちゃうので・・・💰
ありがとうございます。動画興味深く拝見しました。
早速NotebookLM by Dify.AIを試したのですが、最後のPodcast audio generatorの処理で「Run failed: None is not a valid FileType」が発生して音声ファイルを生成できませんでした。こんな事象は発生しなかったでしょうか?
にゃんたさんいつも動画ありがとうございます!
T.S-i1gさんありがとうございます。、 私も同様です。まず最初、PDFサイズが大きすぎて、claude api側で529Error overloadが出たので、極力PDFfileサイズを小さく文章量も少なくしたところ、今度はおなじNone is not..のエラーとなりました。そこで、原因箇所を特定するべく、プレビューにおいて処理を試し、エラーを吐くワークフロー処理から→「!」の項目→「ログを表示」で確認したところ、podcastAudioGeneratorであることがわかりました。ログをGPTにかけて原因箇所をきくと
・sys.filesが空で
ノードが期待する形式のファイルが正しく渡されてないんじゃない?
と言われたのですが、dify初心者なのでよくわからず、一旦ここで断念しています。
[追記]
気づいた点は、テンプレを作成時には、WAITINGノードに
/TEMPLATE CONVERSION
output
String
の出力?がないことでした。にゃんたさんの動画内ではありました。
そこで、/をいれて上記の値を次のノードに引き渡すように指定したのち、再度かけましたが同じ結果に。
また解決策がわかれば書きます。
コメントありがとうございます!
私が試していた時は大丈夫だったのですが、
現在のバージョンだと発生するバグのようですね・・・!
github.com/langgenius/dify/issues/11184
次のバージョンで改善されるということでした🤔
有用な情報ですね。ただ、RAG(ナレッジ)との差がよくわかりませんね。長い文章とそうではない場合に分けて使うということなんですかね。RAGの場合は、質問と類似した文章を検索し、それを質問とともにAIに投げるはずですが、ファイルアップロードの場合の仕組みはどうなっているのでしょうか?使い方的には、大量の文章の中から必要な文章を検索してもらい、そのファイルをさらにファイルアップロードを使い要約してもらうなどの2段階的な使い方になるのかな。
ありがとうございます!
今回紹介したものは、プロンプトの中に全て文章を埋め込んでいますね!
精度に関しては埋め込んだ方が良いですが、コストに関してはRAGの方が良いというところで
ユースケースに応じて使い分けできると良いかもしれませんね🤔
色々使えますよね。課題はイメージPDF(テキストが画像だけで埋め込まれていないPDF)のOCR処理を途中で入れるのが難しいところでしょうか
地味なんですが、仕事で使おうとしたら嬉しい機能ですよね・・・!
そうですね!Claudeの最新PDF読み込みAPIが使えるようになったら
そこらへんが解決できるかもですが、現状だとPDFの画像処理が難しいですよね🤔
Whisper v4って出そうですか?
そろそろ1年
Whisper v4出て欲しいですね・・・!
ただOpenAIは音声入力だけではなくて
音声入力もできるマルチモーダルなモデルの開発を
優先度高くやってそうな感じもしますよね🤔