title | tags | description |
---|---|---|
自然語言處理 - 動物疫情資訊平台 |
工作整理 |
自然語言處理 |
結合網路爬蟲與串接OpenAI建立文獻查找、翻譯及摘要與音檔自動生成會議記錄的功能。
👉API : OpenAI、Whisper 👉網頁部署 : Langchain、Chainlit
利用網路爬蟲,爬取指定來源論文,並利用GPT-4o模型一鍵自動翻譯與摘要全部論文。
_github.mp4
使用者可上傳音檔或選擇Youtube或Googledrive音檔來源連結。先利用Whisper模型轉換音檔成文字,再使用GPT-4o模型加上Prompt engineering技術生成指定格式會議紀錄。
_github.mov
- audio2text_function.py:語音轉文字+逐字稿生成+會議紀錄整理
- get_ytgd_function.py:獲取Youtube或Google drive音檔
- paper_func.py:文獻爬蟲+翻譯+摘要
- paper_web.py:網頁部署
- chainlit.md:網頁簡介內容可在此更改
- .env:隱藏檔,存放Open API的key
- .chainlit:隱藏檔,可以改一些網頁介面設置
- public:主要存放要更改網頁的css,js,logo檔的地方