Root Nation文章技術什麼是神經網絡以及它們如何工作?

什麼是神經網絡以及它們如何工作?

-

今天我們將嘗試弄清楚神經網絡是什麼、它們如何工作以及它們在創建人工智能中的作用。

神經網絡。 我們幾乎到處都能聽到這句話。 甚至在冰箱裡你也會發現神經網絡(這不是玩笑)。 神經網絡被機器學習算法廣泛使用,如今不僅可以在計算機和智能手機中找到,還可以在許多其他電子設備中找到,例如家用電器。 您有沒有想過這些神經網絡是什麼?

別擔心,這不會是一場學術講座。 有許多出版物,包括烏克蘭語的出版物,非常專業且可靠地解釋了精確科學領域的這個問題。 此類出版物已有十幾年曆史。 這些舊出版物怎麼可能仍然具有現實意義? 事實上,神經網絡的基本原理並沒有改變,這個概念本身——人工神經元的數學模型——是在第二次世界大戰期間創建的。

什麼是神經網絡以及它們如何工作?

與互聯網一樣,今天的互聯網比發送第一封電子郵件時要先進得多。 互聯網的基礎、基本協議從其創建之初就存在。 每個複雜的概念都是建立在舊結構的基礎上的。 我們的大腦也是如此,如果沒有最古老的進化元素:腦幹,最年輕的大腦皮層就無法發揮作用,腦幹的歷史遠早於我們這個星球上物種的存在。

我是不是讓你有點困惑了? 那麼讓我們更詳細地了解一下。

也很有趣: ChatGPT:簡單的使用說明

什麼是神經網絡?

網絡是某些元素的集合。 這是數學、物理或技術中最簡單的方法。 如果計算機網絡是一組互連的計算機,那麼神經網絡顯然就是一組神經元。

神經網絡

然而,這些元素的複雜性與我們大腦和神經系統的神經細胞根本無法相提並論,但在一定的抽像水平上,人工神經元和生物神經元的一些特徵是常見的。 但有必要記住,人工神經元的概念比其生物神經元簡單得多,我們仍然對生物神經元知之甚少。

- 廣告 -

另請閱讀: ChatGPT 的 7 個最酷的用途

首先有一個人工神經元

第一個人工神經元的數學模型是由兩位美國科學家 Warren McCulloch 和 Walter Pitts 於 1943 年開發的(是的,這不是一個錯誤,是在第二次世界大戰期間)。 他們成功地在跨學科方法的基礎上做到了這一點,結合了腦生理學的基礎知識(記住這個模型創建的時間)、數學和當時年輕的IT 方法(他們使用了阿蘭·圖靈的可計算性理論等) )。 McCulloch-Pitts人工神經元模型是一個非常簡單的模型,它有很多輸入,其中輸入信息通過權重(參數),其值決定神經元的行為。 結果被發送到單個輸出(參見 McCulloch-Pitts 神經元圖)。

神經網絡
人工神經元的方案1. 其輸出信號被輸入到給定神經元的輸入的神經元2. 輸入信號的加法器3. 傳遞函數計算器4. 給定神經元的信號應用於其輸入的神經元5. ωi — 輸入信號的權重

這種樹狀結構與生物神經元有關,因為當我們想到描繪生物神經細胞的圖畫時,我們想到的就是樹突的特徵樹狀結構。 然而,人們不應該屈服於一種錯覺,認為人工神經元至少在某種程度上接近真實的神經細胞。 這兩位研究人員是第一個人工神經元的作者,他們成功地證明了任何可計算函數都可以使用互連神經元網絡來計算。 然而,讓我們記住,這些最初的概念只是作為僅存在於“紙上”的想法而創建的,並且沒有以操作設備的形式進行真正的解釋。

另請閱讀: 關於量子計算機 簡單來說

從模型到創新實施

麥卡洛克和皮茨開發了一個理論模型,但第一個真正的神經網絡的創建卻等了十多年。 它的創造者被認為是人工智能研究的另一位先驅弗蘭克·羅森布拉特(Frank Rosenblatt),他於1957 年創建了Mark I 感知機網絡,而您自己也證明,由於這種結構,機器獲得了一種以前只有動物和人類所固有的能力:可以學。 然而,我們現在知道,實際上還有其他科學家提出了機器可以學習的想法,包括在羅森布拉特之前。

馬克一號感知器

1950 世紀 1952 年代,許多研究人員和計算機科學先驅提出瞭如何讓機器完成其自身無法完成的任務的想法。 例如,阿瑟·塞繆爾(Arthur Samuel)開發了一個與人類下跳棋的程序,艾倫·紐厄爾(Allen Newell)和赫伯特·西蒙(Herbert Simon)創建了一個可以獨立證明數學定理的程序。 甚至在羅森布拉特的第一個神經網絡創建之前,人工智能領域的另外兩位研究先驅馬文·明斯基(Marvin Minsky)和迪恩·埃德蒙茲(Dean Edmonds)就在年,也就是在羅森布拉特的感知器出現之前,就構建了一台名為SNARC(隨機神經網絡)的機器。 Analog Reinforcement Calculator) - 隨機神經模擬強化計算器,被許多人認為是第一台隨機神經網絡計算機。 應該指出的是,SNARC 與現代計算機無關。

納克

這台功能強大的機器使用了 3000 多個電子管和 B-24 轟炸機的備用自動駕駛裝置,能夠模擬 40 個神經元的操作,結果足以在數學上模擬老鼠尋找迷宮出口的過程。 當然,沒有老鼠,只是一個推演、尋找最優解的過程。 這輛車是馬文·明斯基博士的一部分。

阿達琳網絡

神經網絡領域另一個有趣的項目是 ADALINE 網絡,由 Bernard Withrow 於 1960 年開發。 因此,人們可以問這樣一個問題:既然半個多世紀前,研究人員就了解了神經網絡的理論基礎,甚至創建了此類計算框架的第一個工作實現,為什麼花了這麼長時間,直到21世紀,才基於神經網絡創建真正的解決方案? 答案是:計算能力不足,但這並不是唯一的障礙。

神經網絡

儘管在 1950 世紀 1960 年代和 年代,許多人工智能先驅都對神經網絡的可能性著迷,其中一些人預測,相當於人類大腦的機器只需十年的時間。 今天讀起來甚至很有趣,因為我們還沒有接近創造出相當於人腦的機器,而且我們距離解決這項任務還很遠。 人們很快就發現,第一個神經網絡的邏輯既令人著迷,又存在局限性。 使用人工神經元和機器學習算法的人工智能的首次實現能夠解決某些狹窄範圍的任務。

然而,當涉及到更廣闊的空間,解決一些真正嚴肅的事情,比如模式和圖像識別、同聲翻譯、語音和手寫識別等,也就是今天計算機和人工智能已經可以做到的事情時,事實證明,神經網絡的最初實現根本無法做到這一點。 為什麼會這樣呢? Marvin Minsky(是的,來自 SNARC)和 Seymour Papert 的研究給出了答案,他們在 1969 年證明了感知器邏輯的局限性,並表明僅僅通過縮放來提高簡單神經網絡的能力是行不通的。 還有一個但非常重要的障礙——當時可用的計算能力太小,神經網絡無法按預期使用。

也很有趣:

- 廣告 -

神經網絡的複興

在 1970 世紀 1980 年代和 年代,神經網絡幾乎被遺忘了。 直到上世紀末,可用的計算能力變得如此強大,人們才開始回歸併發展他們在該領域的能力。 就在那時,新的函數和算法出現了,能夠克服第一個最簡單的神經網絡的局限性。 正是在那時,出現了多層神經網絡深度機器學習的想法。 這些層實際上發生了什麼? 如今,在我們的環境中運行的幾乎所有有用的神經網絡都是多層的。 我們有一個輸入層,其任務是接收輸入數據和參數(權重)。 這些參數的數量根據網絡要解決的計算問題的複雜性而變化。

神經網絡

此外,我們還有所謂的“隱藏層”——這就是與深度機器學習相關的所有“魔法”發生的地方。 隱藏層負責該神經網絡學習和執行必要計算的能力。 最後,最後一個元素是輸出層,即給出期望結果的神經網絡層,在本例中:識別的筆跡、面部、語音、基於文本描述形成的圖像、斷層掃描分析的結果診斷圖像等等。

另請閱讀: 我測試並採訪了 Bing 的聊天機器人

神經網絡如何學習?

眾所周知,神經網絡中的各個神經元借助參數(權重)處理信息,這些參數被分配了單獨的值和連接。 這些權重在學習過程中發生變化,這使您可以調整該網絡的結構,以生成所需的結果。 網絡到底是如何學習的? 顯然,它必須不斷地訓練。 不要對這句話感到驚訝。 我們也在學習,這個過程不是混亂的,而是有序的,可以說。 我們稱之為教育。 無論如何,神經網絡也可以進行訓練,這通常是使用適當選擇的一組輸入來完成的,這以某種方式為網絡將來執行的任務做好準備。 而這一切都是一步步重複的,有時學習過程在某種程度上類似於訓練過程本身。

例如,如果這個神經網絡的任務是識別人臉,那麼它是在大量包含人臉的圖像上進行預訓練的。 在學習過程中,隱藏層的權重和參數會發生變化。 專家在這裡使用了“成本函數最小化”這個短語。 成本函數是一個告訴我們給定神經網絡犯錯誤程度的量。 我們越能最小化訓練結果的成本函數,該神經網絡在現實世界中的表現就越好。 將任何神經網絡與使用經典算法編程的任務區分開來的最重要特徵是,在經典算法的情況下,程序員必須逐步設計程序將執行的操作。 就神經網絡而言,網絡本身能夠自行學習正確執行任務。 沒有人確切知道複雜的神經網絡如何執行其計算。

神經網絡

如今,神經網絡被廣泛使用,但令人驚訝的是,神經網絡常常不了解給定網絡中的計算過程實際上是如何工作的。 沒有必要這樣做。 程序員使用現成的機器學習神經網絡,這些網絡是為某種類型的輸入數據準備的,以只有他們知道的方式處理它們並產生所需的結果。 程序員不需要知道神經網絡內部的推理過程是如何工作的。 也就是說,一個人遠離大量的計算,這是一種獲取信息及其通過神經網絡進行處理的方法。 人類對人工智能模型的某些恐懼由此而來。 我們只是擔心有一天神經網絡會給自己設定一項任務,並在沒有人幫助的情況下獨立找到解決它的方法。 這讓人類感到擔憂,導致人們對機器學習算法的使用感到恐懼和不信任。

聊天工具

這種功利主義的做法如今很常見。 我們也是如此:我們知道如何在特定活動中培訓某人,並且我們知道如果做得正確,培訓過程將是有效的。 一個人將獲得所需的技能。 但我們是否準確地理解了他大腦中的演繹過程是如何發生的,從而導致了這種效果呢? 我們不知道。

科學家的任務是盡可能多地研究這些問題,以便它們在必要時為我們服務和幫助,而且最重要的是,它們不會成為威脅。 作為人類,我們害怕我們不知道的東西。

也很有趣: 

Yuri Svitlyk
Yuri Svitlyk
喀爾巴阡山脈之子、不為人知的數學天才、“律師”Microsoft,實用的利他主義者,左右
- 廣告 -
註冊
通知有關
客人

0 留言
嵌入式評論
查看所有評論