GPTresearch 是一款基於Open AI GPT-4 多模態大型語言模型所開發的研究輔助工具,旨在協助研究人員完成各項學術工作,可有效填補語言鴻溝,並縮減從發想到學術著作的研發週期。
- 必要: Windows 10/11, Microsoft Word
- 選配: pytesseract,下載安裝 https://digi.bib.uni-mannheim.de/tesseract/
步驟3~6為避免執行檔被windows 11防毒軟體擋掉,windows 10 可跳過
- 連絡管理者取得授權並下載檔案: https://drive.google.com/drive/folders/1AOQoYaXLslQTJ89NRsKChc3JD1IYiWuL?usp=sharing
- 開一個資料夾
- 開始選單中搜尋「病毒」,並點選「病毒與威脅防護」。
- 在「病毒與威脅防護設定」中,點選「管理設定」。
- 捲動到底部,找到「排除項目」,點擊「新增或移除排除項目」。
- 點選「新增排除範圍」,選擇你該資料夾。
- 將檔案解壓縮至該資料夾。
- 用文字文件開啟config.ini設定openai金鑰 [openai]key1, key2
- 用文字文件開啟config.ini設定pytesseract 路徑
- 點選GPTresearch.exe即可執行。
-
在python3.8的環境下執行:
pip install -r requirements.txt
-
新增資料夾./input_folder ./output_folder
-
修改config.ini內部openai金鑰
-
修改config.ini內部pytesseract的路徑 (optional)
- output_folder: 輸出的檔案在這裡
- config.ini: 設定檔
執行版從介面選擇功能並輸入需要要求;編譯版從下列功能中擇一,修改並執行main.py。
research_wordcloud(topic=研究領域, background_color='black', interval=1)
- 給定一個領域主題,搜尋近一年來的相關文章找出熱門研究方法,並繪製關鍵詞雲圖
- 一次一個領域主題
- background_color: 背景顏色
- interval: 搜尋時間範圍(年)
- 輸出檔案: 領域主題.png
- 執行版影片: https://youtu.be/s8YgKynFv3g
search_paper_by_paragraph(paper_N=2, keyword_N=2)
- 給定一個文章、關鍵字數量與需要的文獻數量,從文字中提取關鍵字並搜尋相關聯的文獻
- 一次一個文件(.pdf/.docx)
- keyword_N: 要提取幾個關鍵字,paper_N: 每個關鍵字要找幾個文獻
- 輸出檔案: 輸入檔名_reference.docx
- 執行版影片: https://youtu.be/wJvj5dmvHR8
batch_analyze_paper(chinese=True)
- 給定論文內容,以英文找出該的資訊並分析該論文的方法、實驗、貢獻(0~100分)、缺點
- 一次多個文獻(.pdf/.docx)
- 可製作中文分析(chinese=True)
- 輸出檔案: Reading.docx / Reading_ch.docx
- 執行版影片: https://youtu.be/mWo5Ex-q-bc
grammar_check()
- 給定論文內容,修正文法錯誤並改用較學術的表達方式英文潤稿
- 一次一個文獻(.docx)
- 輸出檔案: 輸入檔名_revised.docx
- 執行版影片: https://youtu.be/IcUN8Xl_1ls
professinal_translation(domain="neurobiology", language='ch')
- 在指定範圍內將輸入翻譯成特定語言,範圍可自行輸入
- 支援中文(ch)、英文(en)、日文(jp)、德文(de)雙向翻譯
- 一次多個檔案(.docx)
- 輸出檔案: 輸入檔名_語言.docx
- 執行版影片: https://youtu.be/AxUKeB1OTyU
solve_problem(language='en')
- 給定題目的圖片,回覆該題目的解法與可能的答案
- 一次一個照片(.jpg/.png)
- 未安裝pytesseract不可使用 (安裝步驟2、3)
- 輸出檔案: 圖片檔名_answer.docx
- 題目是中文(ch)或者英文(en)
- 執行版影片: https://youtu.be/jINbLh1Feqk
coding(text1, language="C++")
- 產出符合要求的程式碼,所有流通的程式語言都可以
- 輸出檔案: 時間_程式語言.txt
- 執行版影片: https://youtu.be/A2X7DiNZQbw
code_exchange(to_language="python")
- 將輸入的程式碼轉換成相同功能的其他程式語言
- 一次多個檔案(一般程式碼腳本)
- 輸出檔案: 輸入檔名_程式語言.txt
- 執行版影片: https://youtu.be/NsO7_za1y7E
abstract(language='en', word=200)
- 輸入文章,依照字數要求產出摘要
- 一次多個檔案(.pdf/.docx)
- 可支援中文(ch)英文(en)
- 輸出檔案: 輸入檔名_abstract.txt
- 執行版影片: https://youtu.be/n9n4JuQq974
reference_rearrange(reference_type=格式範例)
- 給定引用格式範例,將參考文獻的閱讀報告以出現順序做成引用列表
- 一次一個檔案(.docx)
- 輸出檔案: 輸入檔名_rereference.docx
- 執行版影片: https://youtu.be/8Yo3UFeYOiI
write_introduction_by_reference(word=1000, reference_type=格式範例)
- 輸入文獻閱讀的報告,以其中的文獻撰寫指定字數的Introduction,並在結尾以出現順序編排引用清單
- 一次一個檔案(.docx)
- 輸出檔案: 輸入檔名_introduction.docx
- 執行版影片: https://youtu.be/r8v-9UXeVtE
GPTresearch僅作為研究活動上的輔助工具,研究過程中的實驗、論證還需仰賴學者自身的學養與智識,任何產出的結果須經過人為查驗以確保知識的正確性。
CONTACT: [email protected]
This work is supported by National Taiwan University Robotics Lab.










