生成式人工智能的定義:它的含義及其工作原理

Jacki

什麼是生成式人工智能?

生成式人工智能是一種人工智能技術,它根據用戶輸入的提示生成內容,並從“訓練”過的現有數據中提取模式。其複雜的預測算法可用於創建文本、視頻、圖像等,或者只是在 ChatGPT 等平台上以令人信服的人類對話方式與用戶進行交互。

儘管 GenAI 是一項相對較新的人工智能技術,並於 2022 年隨著 ChatGPT 的公開發布而成為主流,但 GenAI 領域正在迅速發展,在許多行業已經得到廣泛採用。如今,它通常用於為聊天機器人、編碼輔助工具、翻譯應用程序、圖形設計平台等提供支持。

生成式人工智能對技術的未來意味著什麼?這是一件大事。 GenAI 工具可以在幾秒鐘內以極低的成本執行耗時的人工任務。它具有以無數方式提高人類生產力和創新的潛力。例如,GenAI 正在引領重大突破通過分析組織圖像來檢測癌症。

隨著人工智能功能逐漸集成到主要網絡瀏覽器中,它也正在改變我們上網的方式像谷歌瀏覽器,並且它可能通過為我們每天使用的物理設備(例如智能家居技術)提供與互聯網接口的新功能,從而促進物聯網(IoT)領域的快速發展。

生成式人工智能的工作原理

雖然 GenAI 程序的內部運作極其複雜,但簡單的說法是,它們分析用戶的提示,並根據從大量訓練數據(包括文本、圖像以及來自互聯網、書籍等的其他媒體)中學到的模式生成合適的輸出。

換句話說,GenAI 利用對其訓練數據中統計關係的理解,預測最有可能形成對給定提示的相關響應的單詞或圖像序列。雖然 GenAI 可能並不總是正確,但新的和改進的模型正在不斷發布,更新的訓練數據集意味著響應的準確性和相關性可能會不斷提高。

以下是生成式人工智能工作原理的更詳細分解:

  1. 用戶提供提示:這可能是一個問題、一項任務或對要創建的內容(如圖像)的描述。提示可能會這樣寫:“寫一個關於機器人和廢棄房屋的恐怖短篇故事。”或者,“按照米開朗基羅繪畫的風格,創建一個小貓圓屋踢小丑的圖像。”

  2. AI 解釋提示:GenAI 程序將提示分解為片段,稱為“令牌”。它將構成提示的標記中的模式與其訓練數據中的類似模式進行比較,並使用它找到的內容來預測最能滿足提示的響應。

  3. AI 生成輸出:該輸出可能是文本、音頻、視頻或其他形式,具體取決於 AI 工具和提示。由於 GenAI 單獨分析每個提示,因此不太可能兩次給出相同的答复。即使多次使用相同的提示,輸出通常也是唯一且原始的。

用戶輸入提示,“創建一個小貓圓屋以米開朗基羅繪畫風格踢小丑的圖像”,生成人工智能會解釋它,生成圖像。

重要的是要記住,儘管人工智能的輸出聽起來像人類,但它並不像人類那樣思考、推理或感覺。事實上,GenAI 根本不智能。任何智能幻覺都只是基於其基於海量數據集進行統計預測的能力。就像計算器一樣,它根據其編程響應輸入。

生成式人工智能模型

您可能聽說過 ChatGPT,這是最流行的 GenAI 工具,OpenAI 創始人 Sam Altman 聲稱該工具正在被使用多達8億人。但這只是單一類型的生成人工智能的一個例子。

生成式人工智能模型有很多不同類型,包括:

  • 大型語言模型(LLM):為 ChatGPT 提供支持的“生成式預訓練 Transformer”(GPT)等法學碩士專門針對文本源進行了訓練。他們的目的是重新創造和“理解”人類語言。法學碩士使用深度學習(機器學習的一種高級類型)來預測對基於文本的提示的響應。

  • 擴散模型:這些模型用於生成圖像。它們的工作方式有點像反向創建一幅畫,首先創建一個嘈雜、混亂的圖像,然後逐漸完善它,直到它被認為滿足用戶的提示。

  • 變壓器型號:這些模型是現代 GenAI 工具的支柱。他們使用一種稱為標記化的方法將提示分解為算法可以理解的小部分(稱為標記)。然後,該算法會尋找標記與其訓練之間的聯繫,以生成細緻入微的人類輸出和逼真的圖像。

  • 多式聯運模型:這些模型集成了許多數據源——通常包括文本、圖像和音頻——以促進多種類型內容的生成。這使得單個 GenAI 工具能夠執行多種任務。

  • 基礎模型:這些模型是許多人工智能功能的基礎,為生成文本、圖像等提供核心智能。它們經過大量數據的訓練,可以針對特定任務進行微調和更新。 LLM、擴散模型、變壓器模型和多模態模型都可以是基礎模型。

  • 生成對抗網絡(GAN):這些人工智能模型結合了兩個神經網絡,每個神經網絡都有一個單獨的任務。第一個網絡創建內容,另一個網絡評估內容的準確性並在必要時對其進行細化。它們通常用於生成圖像和視頻,也可用於創建深度偽造品。

  • 自動編碼器:這些 GenAI 工具壓縮數據並重建數據以識別模式。例如,他們可以分析人聲並將其分解為算法可以重新創建的特徵。它們通常用於語音合成和深度偽造。

生成式 AI 模型的基礎知識

創建生成式人工智能模型需要大量投資和計算能力。雖然成本在下降,但仍花費數百萬建造一個。創建 GenAI 模型需要執行以下操作:

  • 質量訓練數據:模型必須接受大量數據的訓練。所有這些數據都必須準確標記和分類,以便人工智能能夠有效且無偏見地學習。

  • 高級神經網絡:神經網絡是為生成式人工智能提供動力的機器學習系統。它們提供了使人工智能模型能夠做出預測的計算框架。 GPT 就是一個例子(為 ChatGPT 模型提供支持的神經網絡)。

  • 計算能力:運行 GenAI 流程需要大量強大的計算機芯片,需要大量的能量輸入。

    推薦閱讀:LLM 與生成式人工智能:真正的區別是什麼?

這些只是基本必需品。有效的模型還需要不斷的調整和培訓,以提高其能力並防止偏見或有害內容的產生。為此,需要人類和機器的巨大努力。據報導,OpenAI 的支出約為15億美元僅就人員配備而言。

生成式人工智能是如何發展的

事實上,自 20 世紀 60 年代以來,生成式人工智能已經以某種形式存在了數十年。從那時起,科學家、語言學家甚至哲學家一直致力於設計和測試人工智能模型。下面簡要介紹一下 GenAI 的誕生過程。

1966年

第一個聊天機器人名為 Eliza,是由麻省理工學院教授 Joseph Weizenbaum 發明的。 Eliza 被編程為識別提示中的關鍵字並用腳本回復進行回复。

1980年

開發者 Michael Toy 和 Glenn Wichman 創造了第一款程序生成的遊戲,名為 Rogue。遊戲隨機生成環境,使每次遊戲都獨一無二。

1986年-2000年

神經網絡的突破為計算機視覺(例如面部識別)和深度學習奠定了基礎。

2010-2015

蘋果發布了第一個主流人工智能聊天機器人 Siri,幾年後亞馬遜也推出了 Alexa。開發了關鍵的 GenAI 模型,例如生成對抗網絡 (GAN) 和擴散模型,在現實文本和圖像生成方面取得了巨大進步。

2016-2020

谷歌開發了 Transformer AI 模型,該模型成為當今生成式 AI 工具的基礎。 OpenAI 發布了 Generative Pre-trained Transformer (GPT),這是其開創性的法學碩士。

2022年

OpenAI 發布了 ChatGPT,這是一個用戶友好的聊天機器人,可以生成基於文本的原始內容和交互。它超過了1億用戶發布後兩個月內。

2023年

OpenAI 發布了 GPT-4,這是一種生成文本和圖像的多模態 AI。 Google 和 Bing 將 AI 融入到他們的搜索引擎中,新的 GenAI 工具出現了,例如 Claude、Gemini、LLaMA 和 Grok。

2024 年至今

GenAI 成為主流。人工智能已集成到無數的消費產品中,包括社交媒體、照片編輯應用程序和項目管理軟件。超過80%的企業正在使用或探索人工智能的用途,並且超過 50% 的美國人每天與AI互動。

如何使用生成式人工智能

使用生成式人工智能工具的方法有很多種,該技術的用例也有無數。使用生成式人工智能的最簡單方法是訪問 GenAI 工具網站(例如克勞德.ai)或下載 GenAI 應用程序(例如 ChatGPT)。

從那裡開始,就像在文本框中輸入提示一樣簡單。以下是使用最流行的 GenAI 工具 ChatGPT 的分步示例。

  1. 訪問聊天網站。無需註冊帳戶即可使用該工具。但是,如果您不希望 OpenAI 收集您的數據,創建帳戶可以為您提供更多隱私選項。

  2. 在文本框中輸入您的提示。您可以提出問題,給人工智能一個任務(例如,使用剩下的雞肉、洋蔥和冷凍豌豆創建美味食譜),或者要求它生成圖像。如果您不想打字,可以單擊嗓音與 AI 對話的圖標。

  3. ChatGPT 將自動回复您的提示。它的回復不應超過幾秒鐘。

  4. ChatGPT 將記住您在同一對話中的提示及其響應。因此,如果您沒有得到您想要的結果,您可以繼續討論該主題或修改任務。

大多數基於聊天的 GenAI 工具的工作方式與 ChatGPT 類似,加上或減去各種功能,例如實時搜索互聯網以獲取其他上下文的功能。然而,根據您的需求,還有更具體的方法來使用生成式人工智能。

開發人員可以通過向模型創建者請求 API,將 GenAI 集成到他們的工具中。這使他們能夠將人工智能功能添加到自己的產品或應用程序中。當您通過 Google Chrome 和 Bing 等其他搜索引擎執行搜索時,您還可以使用 GenAI。 Google Gemini 現在會自動對 Chrome 上的搜索生成 AI 響應。

您可能還會注意到,人工智能正在您以前使用過的應用程序中突然出現,例如 Notion 或 Snapchat。所有這些應用內 AI 功能均由 GenAI 模型提供支持。如果您以這種方式使用 GenAI,只需知道它不會像直接與 AI 交互那樣通用。

將人工智能集成到其產品中的公司限制了人工智能的範圍,以改善他們提供的特定服務。

生成式人工智能工具示例

雖然 ChatGPT 是最著名的面向消費者的生成人工智能工具,但它遠​​不是唯一的選擇。 GenAI 應用程序有很多,每個應用程序都有不同的訓練和功能。雖然其中一些工具的功能和輸出似乎幾乎相同,但它們的差異可能會對您的體驗、安全和隱私產生影響。

以下是一些流行的生成式人工智能工具的示例。

  • 聊天GPT:ChatGPT 是第一個主流 GenAI 工具,並且仍然是最受歡迎的。它最初是一個純粹基於文本的法學碩士。如今,它是一個多模式模型,可以生成文本、音頻、圖像和代碼。 ChatGPT 可免費使用:聊天網站或通過 ChatGPT 應用程序。

  • 克勞德:Claude 是一個聊天機器人,與 ChatGPT 類似,由 Anthropic 構建,專注於長篇內容生成和 AI 安全。它有一個“憲法人工智能”框架,旨在確保輸出遵循預先編程的道德準則。一些消息來源聲稱這使得它比 ChatGPT 使用更安全對於希望避免偏見或潛在有害反應的用戶。然而,Claude 目前只能生成文本和代碼。

  • 雙子座:Gemini 是 Google 專有的 GenAI,由其提供支持洛杉磯法學碩士。 Gemini 的功能很像 ChatGPT,它可以生成文本、圖像和代碼。 Gemini 也越來越多地集成到 Google 的其他工具中,例如 Chrome 和 Docs。

  • :Le Chat 是法國人工智能公司 Mistral 打造的 GenAI 助手。與 ChatGPT 和 Claude 一樣,它是一個對話式聊天機器人,旨在生成文本和代碼。 Le Chat 因其基於 Mistral 的開放權重模型而脫穎而出,該模型允許透明度和社區驅動的開發。

  • 深度搜索:DeepSeek 是一款開源 GenAI 工具,其質量可與類似應用程序相媲美。 DeepSeek 的構建和訓練成本明顯低於同類產品,因此它被視為 GenAI 開發的突破。但出於實用目的,它與 ChatGPT 等工具沒有太大區別。

  • 來自-E:Dall-E 是 OpenAI 的圖像生成器。用戶通過文字描述他們想看到的內容,人工智能根據提示生成圖像。 Dall-E 基於穩定的擴散模型構建,可在 ChatGPT 中創建圖像作為多模式體驗的一部分。

  • 中途:Midjourney 是另一種文本到圖像生成器,以創建高度詳細的圖像而聞名。但是,它沒有網站。相反,用戶可以通過消息應用程序 Discord 與該工具進行交互。

  • 索拉:Sora 是 OpenAI 的文本到視頻生成器。與 Dall-E 非常相似,用戶編寫文本描述,Sora 根據提示生成 5-20 秒的視頻。雖然 Sora 尚未併入 ChatGPT,但目前可供付費 ChatGPT 客戶使用:索拉網

作為一些最流行的主流 GenAI 工具,主要由信譽良好的公司開發,上面列表中的所有選項通常都可以安全使用。

然而,有許多 GenAI 工具可能不太安全。例如,一些第三方應用程序開發人員使用 API 密鑰將 OpenAI 等公司的人工智能模型集成到自己的應用程序中。但在第三方應用程序中使用該模型可能比通過官方 ChatGPT 應用程序使用模型風險更大。

不值得信賴的第三方應用程序的人工智能網絡安全標準可能較低,這意味著它們可能不安全或危險。有些被稱為“黑暗人工智能”,甚至可能是由惡意詐騙者和黑客專門創建的,目的是竊取您的個人信息或用惡意軟件感染您的設備。

生成式人工智能的未來

生成式人工智能最近才成為主流,因此儘管它很受歡迎,但它仍處於發展的早期階段。即便如此,該技術仍在快速發展,根據調查,78% 的公司至少在一項功能中使用該技術麥肯錫研究

未來十年,GenAI 很可能在功能和採用方面繼續進步,迅速成為每個人日常生活中更重要的一部分。以下是我們在生成人工智能的未來可能看到的一些潛在發展。

  • AI交互將變得更加“人性化”:人工智能目前擅長通過文本複制人類的反應。未來,它將結合聲音、語氣、幽默,甚至人類的身體特徵(人工智能化身)來緊密模仿真實的人類互動。 GenAI 還將變得更具互動性並了解人類語音模式,使其能夠進行更自然的對話。其中許多功能目前已處於早期階段,例如 ChatGPT 的語音模式。

  • 人工智能決策將改善:目前,AI工具可以響應提示。很快,人工智能也許能夠根據其內存中的數據來預測和預見你的需求。人工智能將能夠提出基於上下文的建議、採取行動並在沒有提示的情況下發送警報。

  • 人工智能將變得更具創造力:人工智能編碼、生成視頻、寫作和設計的能力可能會繼續提高。在不久的將來,它可能能夠生成更加細緻的多媒體輸出,積極促進創作過程,而不僅僅是遵循提示者的指示。

使用生成式人工智能的好處

雖然我們可能還無法完全理解生成式人工智能的全部潛力,但它已經帶來了許多切實的好處,包括:

  • 生產力提升:GenAI 可以幫助用戶更快地完成任務,而且通常比他們單獨管理的成本更低。它可以在幾秒鐘內將文本翻譯成外語,撰寫專業的電子郵件和新聞稿,並提出數據驅動的建議——所有這些都具有高度的準確性和效率。

  • 重複性任務的自動化:GenAI 工具可以通過編程來處理耗時或乏味的任務,例如數據輸入、內容編輯和客戶支持。自動化這些功能可以節省企業資金,並允許個人用戶將時間花在更有意義、更具創造性或戰略性的工作上。

  • 高級數據分析:人工智能程序擅長即時分析大量文本或數據。他們可以從法律、醫學、金融、工程和研究等領域的複雜數據集中得出明智的結論,幫助這些領域的專業人士做出更快、更明智的決策。

  • 人際應用:由法學碩士支持的聊天機器人旨在以友好且富有同理心的方式與人類互動。它們可以模仿善良和同情等情緒,這意味著它們可以成為輔導孩子的有用工具,或者在壓力很大的醫療環境中充當醫療專業人員的私人助理。一項研究實際上發現,與醫生相比,患者更喜歡從人工智能那裡獲取醫療新聞,因為人工智能“被認為更具同理心”。

生成式人工智能的局限性和擔憂

生成式人工智能並非沒有缺點。這項技術並不完美,運行人工智能模型的公司也並不完美。生成式人工智能的一些風險包括:

  • 錯誤信息和幻覺:GenAI 有時會生成虛假、有害或誤導性的信息。這被稱為幻覺,是人工智能處理和訓練的局限性造成的。隨著人類對人工智能的信任不斷增強,幻覺有可能助長假新聞和其他錯誤信息。

  • 偏見和公平:GenAI 輸出的響應有時可能存在偏見和歧視。這可能是由於接受的培訓數據不完整或培訓材料中存在的人為偏見造成的。例如,針對過去的申請人進行培訓的招聘工具可能會偏向來自特定學校或背景的未來申請人。

  • 隱私問題:人工智能應用程序會在您註冊時收集您的個人信息,並且許多應用程序會記錄您與人工智能的對話。例如,OpenAI 將 ChatGPT 聊天記錄存儲至少 30 天。這可能會帶來隱私問題,從而增加敏感數據落入壞人之手的風險。

  • 版權問題:OpenAI 是面臨訴訟由《紐約時報》牽頭,圍繞這樣一個事實:該公司使用受版權保護的數據部分訓練其模型,而不補償原始所有者。隨著訓練集不斷擴大以包含更多數據,版權問題可能會成為人工智能公司未來更關心的問題。

  • 環境影響:訓練和運行人工智能模型需要大量的計算能力,可能會導致高碳排放。據報導,ChatGPT 生成的每個回复都會產生大約4.32 克二氧化碳,按工具運行的規模累加。

  • 濫用技術:任何人都可以輕鬆免費訪問 GenAI,這意味著它也很容易被濫用。黑客和詐騙者可以使用這些工具創建令人信服的網絡釣魚消息,誘騙人們交出個人信息。他們還可以使用人工智能來創建深度偽造品和語音克隆來模仿他人或實施釣魚計劃。

使用 Avast 管理 AI 風險

生成式人工智能可以說是自互聯網以來最重要的技術發展,它對個人和公司都具有重大影響。其受歡迎程度增長的一些後果可能是積極的,但 GenAI 的普遍可用性和不可預測性也會使您的安全和隱私面臨風險。

如果沒有保護您的數據和設備免遭不可避免的安全漏洞(無論是數據洩露還是徹頭徹尾的詐騙),請勿使用 ChatGPT 等 GenAI 工具。使用 Avast 免費防病毒軟件保護自己免受欺詐者和惡意軟件的侵害。除了強大的內置詐騙檢測引擎之外,Avast 還提供 24/7 全天候防護,防止惡意軟件、數據洩露等,因此您可以更安全地探索生成式 AI 的諸多優勢。