chatgpt讀取excel 用ChatGPT寫一個數據采集程序
大家好。
上次我們討論了在輔助編程學習上的一些用法:
既然可以理解并生成代碼,那么自然而然,它的作用不僅僅是幫助學習代碼,同樣也可以直接用在實際的軟件開發當中。
對于網頁上的數據采集及處理是的常見應用場景之一。我們來看下是不是也能完成這樣的任務。
假設我們現在需要抓取并整理某個網頁上的表格數據:
我們直接來問問,能不能給個抓取的代碼:
給了我們一份代碼,但很遺憾,把這個代碼復制到編輯器中運行后,生成的是空的。
簡單調試后發現,原來是因為頁面上的表頭元素用的是標簽
而因為沒有獲知具體的頁面代碼信息,直接當做標簽來處理,所以沒采集到表頭信息。
這種情況下,我們可以手動對代碼做一些修改。
或者,我們點擊回答下方的“ ”,讓它重新回答一次試試:
這次給出的代碼比之前簡潔:
import pandas as pd
# 讀取網頁上的表格
url = 'https://python666.cn/static/score.html'
tables = pd.read_html(url)
# 假設目標表格是第一個表格
table = tables[0]
# 將表格保存為Excel文件
output_file = 'table.xlsx'
table.to_excel(output_file, index=False)
print(f"表格已保存為 {output_file}")
運行后,成功得到了我們要的結果:
順利拿到數據后,我們再進一步,讓來對數據進行排序。當然,在排序前,我們需要告訴它關于表格內容的必要信息:
代碼:
import pandas as pd
# 讀取網頁上的表格
url = 'https://python666.cn/static/score.html'
tables = pd.read_html(url)
# 假設目標表格是第一個表格
table = tables[0]
# 將缺失值替換為0
table.fillna(0, inplace=True)
# 計算每個學生的均分
table['均分'] = table.mean(axis=1)
# 按均分降序排序
table.sort_values(by='均分', ascending=False, inplace=True)
# 將表格保存為Excel文件
output_file = 'sorted_table.xlsx'
table.to_excel(output_file, index=False)
print(f"按均分排序后的表格已保存為?{output_file}")
這次,完美實現了我們提出的需求:
可以看出,雖然很強大chatgpt讀取excel,但并不能保證每次生成的代碼都是完美,仍然可能需要引導它修正或人工干預。
但即便如此,它也已經算得上一個十分得力的編程助手,可以大大提高開發效率。尤其像數據處理這種場景,以往開發時常常需要查找各種函數及其參數的使用方法。現在有了chatgpt讀取excel,只要準確描述數據格式及需求,就可以立刻得到相應的處理代碼,非常的方便。
我現在做數據分析已經快離不開它了。
在的新書《碼上行動:零基礎學會編程(版)》中也講解了類似利用進行輔助開發的案例。
本書力求做到淺顯易懂,讓完全沒有編程經驗的零基礎“小白”也能學會。內容從環境搭建這種最基礎的步驟開始講起,逐漸深入到常見的實際應用當中。在講解知識點的同時配有相應的代碼示例,讓讀者可以邊學邊練加深理解。
全書涵蓋環境搭建、基礎語法、常見數據類型、實用模塊、正則表達式、面向對象編程、多任務編程等知識點。另外還提供了爬蟲、GUI、游戲三個實戰項目。
書中還創新地使用作為編程學習的輔助chatgpt讀取excel,帶領讀者探索AI時代下學習編程的新模式。
感謝轉發和點贊的各位~
免責聲明:本文系轉載,版權歸原作者所有;旨在傳遞信息,不代表本站的觀點和立場和對其真實性負責。如需轉載,請聯系原作者。如果來源標注有誤或侵犯了您的合法權益或者其他問題不想在本站發布,來信即刪。
聲明:本站所有文章資源內容,如無特殊說明或標注,均為采集網絡資源。如若本站內容侵犯了原著者的合法權益,可聯系本站刪除。