chatgpt可以做數學題嗎 ChatGPT參加北京高考,能考上哪個大學?
最近有一個非?;鸬娜斯ぶ悄苘浖鹃_發的。
它可以陪你聊天,給你寫發言稿,給你診斷疾病,還能做數學題。人工智能已經進入了一個新的時代。
依然采用了深度神經網絡,這方面的基本原理,我在之前的幾個人工智能的視頻中都談到過。這一回,想和大家一起試試,到底有沒有傳說中的那么厲害?如果讓它參加高考,到底能考上哪個大學呢?
為此,李永樂老師特意從北京市2022年的高考題中選擇了一部分,來考考,內容涉及理科的物理、生物,文科的歷史、政治,當然還包括語數外。化學和地理因為圖太多,不太適合GPT的輸入模式,就被舍棄了。
因為GPT的數據庫只到2021年,而且不會聯機搜索答案,所以它應該沒有看到過這份高考題。把試卷中的所有公式全部修改為格式,讓GPT能夠讀懂。GPT表現得怎么樣?
01 物理
評價:GPT做對了。這題是基礎題,氫原子外圍電子有不同的軌道,吸收光子,電子就會從基態軌道跑到激發態軌道,能量增加。放出光子,電子就從激發態軌道回到基態軌道,能量減少,GPT不光選對了,解釋也非常清楚。
評價:GPT做對了。光是一種橫波,也就是電場和磁場與傳播方向垂直,電場振動的方向叫做偏振方向,只有橫波才會出現偏振現象。還有一種波叫縱波,比如聲波就是縱波,說話的時候空氣前后振動,聲音也向前傳播,縱波是沒有偏振的。另外三種現象所有得波都具有。
評價:GPT做錯了,正確答案應該是B。非常奇怪得一點是:它在答案中明明給出了輸入電流是30A,B選項也說輸入電流是30A,但是它就認為答案B不正確,讓人匪夷所思。
評價:GPT做對了,而且說的很清楚。在跳臺滑雪起跳區,運動員通過猛蹬滑道將滑行能量轉化為向上的速度,并且盡可能快地使自己脫離滑道,從而獲得更多的空中滯留時間和飛行距離。說的很清楚。不過,我之前仔細研究過這個問題,GPT對其它選項的分析還不完全正確。比如A選項助滑時候深蹲,不只是為了積累彈力,也是為了減小下滑時候的空氣阻力。C選項飛行階段采取的姿態,不是為了減小阻力,而反而是為了增加空氣阻力,讓運動員飛行時間更長。
評價:GPT做錯了,正確答案是A。其實GPT的分析都對,但是卻給出了錯誤的選項。
首先,托卡馬克裝置釋放的核能是核聚變的能量,不是等離子體的動能。GPT已經分析出來了,但是它卻沒有選A。等離子體就是在高溫時,原子的一部分電子脫離,形成了電子-正離子的混合體,可以用磁場約束,而且可以導電,B和C都是正確的,GPT也分析出來了。提高溫度的確可以克服庫倫排斥力,讓原子核撞在一起,引發核聚變,D選項也是正確的。不正確的只有A。
總結一下:物理考試5個題,GPT對了3個,正確率60%,算是一個中等生了。
02 生物
評價:GPT做對了。說的非常準確,原核生物沒有細胞核。
評價:GPT做對了。因為雄蜂是未受精的卵細胞發育成的單倍體,精子核體細胞染色體數目一樣,B是不正確的。
評價:GPT做對了。我已經完全看不懂題了,答案說它對它就對。
評價:GPT做對了。的確,天安門沒辦法微重力,這個我還是可以蒙對的。
評價:GPT做錯了,正確答案是C。標準答案解釋說:下丘腦可分泌促腎上腺皮質激素釋放激素,作用于垂體,促進垂體合成并分泌促腎上腺皮質激素,進而促進腎上腺皮質激素的分泌,所以C錯誤;GPT要是會罵人肯定會說:這也太坑爹了。
評價:GPT做對了。金黃色葡萄球菌,我認識這貨還是在工作細胞里。
評價:GPT做錯了,標準答案是A。GPT說了這么多,要是我沒有標準答案我就信了。
評價:GPT做錯了,標準答案是C,這個也屬于普通人連題都看不明白。
評價:GPT做錯了,標準答案是B。
評價:GPT做對了。人家植物都瀕危了,你還用人家培育觀賞植物,這不是玩呢。
總結一下:生物考試10個題,對了6個,正確率60%。和物理一樣。我如果答這個卷子,肯定拿不到60分,GPT參加高考,生物上肯定超過我了。
03 歷史
剛才考了兩門理科,咱們這回再來考考文科吧!文科我喜歡歷史,來看看它考的怎么樣。
評價:GPT做對了,中華文明多元一體。
評價:GPT做對了。北宋特別注重教育,重文抑武中國科舉制度就是在宋朝空前繁榮的。
評價:GPT做錯了,標準答案是D。這兩句話說明:長安和羅馬都曾經是帝國交通網絡的中心。不過,從長安到羅馬的確是東西交流的通道,GPT說的也有道理。
評價:GPT做對了,我連題都讀不懂,GPT都能做對。
評價:GPT做錯了,正確答案是B。這個題有意思了。表面上看:英國很關心中國主權,告訴中國長江不能租押給他國,清政府也保證:這是中國要地,絕對不給別人,好像是維護了主權完整。可實際上呢?英國政府所說的他國,是除了英國之外的他國,換句話說長江沿岸只能租押給英國。清政府說了嘴硬的話——中國要地,不予他國。實際上是默認了長江成為英國的勢力范圍。這需要結合歷史背景知識才能答對,只從字面上讓GPT理解,的確有點強人所難了。
評價:GPT做對了。1946年國民黨召開政協會議,史稱舊政協,用來區分1949年召開的新政協。4月8日,美軍護送王若飛、博古、葉挺、鄧發等人返回延安,結果延安下雨無法降落,飛機返航。途中迷失方向,撞在山西省黑茶山,機上14分全部遇難。
評價:GPT做對了。
評價:GPT做錯了,標準答案是C。非洲不是中國的周邊國家,肯定不能選A,顯然活動是文化交流的一部分,應該選C。建交高潮發生在五六十年代,緊跟著非洲兄弟就把我們抬進了聯合國。非洲11國也不都是金磚國家,D選項有點狹隘。
答:GPT做對了。西亞有兩河流域,北非有埃及,這都是人類最早的文明,字母、雕刻和冶鐵技術這里都有,所以馬丁貝爾認為希臘文明發源于西亞和北非??墒桥`主民主制好像是希臘的城邦自創的chatgpt可以做數學題嗎,我看過一種說法說因為希臘的地理條件,造成它們的工商業比較發達,做生意需要平等chatgpt可以做數學題嗎,于是就發展出了民主制,不知道這種說法有沒有道理。
評價:GPT做錯了,標準答案是C。歐洲一直采用類似于中國春秋戰國時代的分封制,國王的權力很有限。為了獲得民眾的支持,才成立了下議院,國王需要經過議會同意才能加稅,A不對。這是一種妥協,說明國王需要聯系市民,應該選C。英國的世襲貴族控制著上議院,下議院是市民選舉產生的,而下議院的權力比上議院大,所以D不對。至于君主立憲,那更是17世紀的事情了,B不對。這個題連我都會,GPT不知道為什么犯糊涂了。
評價:GPT做對了。書我沒看過,題目也不會,但是GPT能夠選對,厲害。
評價:GPT做對了,真是強??!
評價:GPT做錯了,答案是B。對每一條內容的背景,GPT都準確做出了判斷。但是按照時間排序卻沒有排清楚,遺憾。
總結一下:在歷史考試的13個題目中,GPT錯了5個,對了8個,正確率61.5%。與物理、生物的正確率都差不多。
類似的,我還測試了政治考卷。在13個選擇題中對了7個,正確率54%,看起來,GPT的政治不太好。
文理科考試就到這了。下面是主課:語數外的考察。可以預見,作為一個用英文資料訓練出的語言模型,英語考試自然是不在話下,那么它能得多少分數呢?我們來試試。
04 英語
第一個題是完形填空,就是根據上下文,選一個正確的詞填進去。我們看看GPT的表現。
GPT給出的回答是:
經過檢查,GPT在這一題中全對!雖然意料之中,但依然感覺非常神奇。想起我上高中的時候,英語完形填空都是連錯。
后面我又讓GPT做了閱讀理解,正確率也非常高。整個客觀題部分一共有39個選擇題,GPT對了36個,只錯了3個,正確率高達92%,已經達到了英語優等生得水平了。
那么,書面表達能力怎么樣呢?英語考試書面表達有兩個問題,第一題是閱讀一段短文,然后用英文回答問題。題目是:
GPT回答:
簡單翻譯一下:
題目問:湯姆在自己的學校目睹了什么? GPT說:湯姆親眼目睹了他所在學校的孩子們大量飲用含糖飲料。 題目問:湯姆從哪里得到樂趣瓶的最初模型的想法? GPT說:湯姆最初的靈感來自于觀察他媽媽如何制作健康的水果飲料,但后來又很難找到隨身攜帶的飲料。 題目問:請判斷下列句子中哪部分是錯誤的,并在下面劃線并解釋原因。 Tom最自豪的是樂趣瓶為其他人提供了機會,因為他不僅提供了含糖飲料的健康替代品,而且還將所有利潤捐贈給了OHG。 GPT說:該聲明的錯誤部分是“將所有利潤捐贈給OHG”。文章指出,湯姆將部分利潤捐贈給了健康一代組織(OHG),而不是全部利潤。 題目問:在湯姆的品質中,你認為哪一點對我們來說是重要的?為什么? GPT說:湯姆的品質之一對我們很重要,那就是他的毅力。他建議其他年輕的創業者要準備好經歷很多的高潮和低谷,沒有一夜成名的事情。這種品質很重要,因為它強調了努力工作和實現目標的決心的重要性。
我找了一位英語老師,給GPT的回答進行評價。這一題12分,他給了9分。
最后是英語大作文,以下是題目和GPT的回答。
簡單翻譯一下GPT的回答:
親愛的吉姆, 你好嗎?我希望你一切都好。我寫信是想邀請你給我和我的同學做一個關于英語寫作的在線演講。 如你所知,我們是中國的高中生,我們需要參加大學入學英語考試。寫作是考試中最具挑戰性的部分之一。我們想學習你的寫作經驗和技巧,以提高我們的寫作水平。 我們計劃在即將到來的北京時間周六上午10點進行網上談話。我們會用Zoom來開會。請讓我知道這個時間對你是否合適。另外,請告訴我們你演講的具體主題和時長。 期待您的回復。 你的,李華。
這篇作文我也發給了英語老師,滿分20分,英語老師給了14.5分,屬于及格線以上。
綜上,英語寫作部分的32分,GPT得了23.5分chatgpt可以做數學題嗎,得分率73%,低于客觀題92%的得分率,但是也遠遠高于用中文表述的物理、生物、歷史題。
把主觀題和客觀題綜合在一起,英語考試中GPT得分86分。由于英語選擇了全部試題,這個分數是準確度比較高的。
05 數學
咱們再來看看數學考試吧!都說的數學不好,這是真的嗎?
2022年北京高考數學題的選擇題部分一共有10個題,一個題有配圖需要拿掉。余下9個題。以下是題目和GPT的回答:
九個題中,GPT對了6個,正確率66.7%。雖然比英語略低,但還是高于物理、生物和歷史科目。
我也測試了一部分數學主觀題,發現雖然它有一定的推理能力,但是一本正經說瞎話的時候還是居多,GPT要想真正完成數學考試,可能還得學習一個。
GPT做的數學主觀題
06 語文
最后還要測試語文,還是那句話,在GPT訓練過程中,中文資料相對較少,所以在理解中文方面,GPT可能還存在欠缺。語文考試,我們就僅以作文為例進行測試吧!
語文考試有兩個作文,一個小作文和一個大作文。首先來看小作文的題目和GPT的回答:
我覺得寫的不錯。再來看看語文大作文,題目是:
GPT給出的答案:
個人感覺這篇大作文有點空洞無物,不知道語文老師會怎么評價?我把這兩篇作文都發給了一位資深語文老師,這是她的回復:
語文老師就是厲害,一眼就看出了這篇文章是AI寫的。于是60分的作文,得了40分,66.7%,與數學相差無幾。
綜上,按照我現有的測試,GPT各科的正確率如下:
因為北京高考是需要考語文數學英語,各150分,另外六門史地政理化生,選考3門,每一門100分。如果GPT選考歷史、物理和生物,那么他的得分情況是:
一共能拿到511分。當然,這個分數最終還要賦分,就是按照排名折合成一個新的分數,但是因為排名我們不知道,所以也沒辦法知道具體的折合結果。假如,賦分之后,依然是511分,那么能考上什么學校呢?
京內211高校里,最低分是北京中醫藥大學,516分,還差一點。
京外211高校里,新疆大學最低509分,GPT剛好可以考上。
結論是:如果GPT參加2022年北京高考,大約可以考上新疆大學。
當然,如果加入大量的客觀題,GPT的分數可能沒有這么好,它一本正經說瞎話的本事還是挺強的。但是,GPT基本上相當于一個剛出生的嬰兒,而且人家基本上是個英語娃,非要參加漢語書寫的考試,如果再進行一段時間的訓練,考到600多分是完全有可能的。
其實,我們教學的過程不也是這樣嗎?通過大量的題目,訓練調整學生們神經元的連接,最后讓他們學會自主解題,這和用大量數據喂給,讓它自動調整參數,是一樣的。只不過,GPT的學習速度非常快,它用一天的時間,可能可以達到人類數百年的學習力。
深度神經網絡
我相信,GPT一定能夠深刻的改變社會。就像蒸汽機將人類帶入了蒸汽時代,發電機將人類帶入了電氣時代,計算機將人類帶入了電子時代,互聯網將人類帶入了信息時代一樣,未來已經來了。
法拉第發明的圓盤發電機
有人問:人工智能會產生自我意識統治人類嗎?終結者的情節會出現嗎?我想,在人工智能統治世界之前,那個掌握最強人工智能技術的公司或者人,就會統治世界了,而這可能是我們更需要擔心的。
免責聲明:本文系轉載,版權歸原作者所有;旨在傳遞信息,不代表本站的觀點和立場和對其真實性負責。如需轉載,請聯系原作者。如果來源標注有誤或侵犯了您的合法權益或者其他問題不想在本站發布,來信即刪。
聲明:本站所有文章資源內容,如無特殊說明或標注,均為采集網絡資源。如若本站內容侵犯了原著者的合法權益,可聯系本站刪除。