📻國立教育廣播電臺【新聞真假掰】生成式AI引爆生產力革命的創新應用有哪些?奠基於全球前20大超級電腦「台灣杉二號」,台灣版ChatGPT優勢何在?(逐字稿大公開)
📻國立教育廣播電臺【新聞真假掰】生成式AI引爆生產力革命的創新應用有哪些?奠基於全球前20大超級電腦「台灣杉二號」,台灣版ChatGPT優勢何在?(逐字稿大公開)
📻國立教育廣播電臺【新聞真假掰】節目資訊
播出時間:每周日17:05-18:00
收聽方式:國立教育廣播電臺、官網60天隨選收聽
📌邀訪來賓
吳漢章 華碩雲端總經理
📌完整訪談內容Podcast
📌節目介紹
生成式AI正在改寫未來,為了不讓科技巨頭獨佔資源,各國都想發展屬於自己的ChatGPT,台灣在人工智慧領域,有什麼機會呢?
台智雲總經理吳漢章在節目中,為大家詳解台灣科技業的超前部屬!2018年,國研院國網中心「前瞻計畫」斥資4年50億元打造的超級電腦「台灣杉二號」,在「算力即國力」的時代,它就是台灣發展生成式AI的加速器。
台智雲以台灣杉二號建立繁中版大型語言模型「福爾摩沙大模型」,它的參數多達1760億個,與ChatGPT-3.5不相上下。福爾摩沙大模型除了擁有豐富的繁中資料庫,更能支援鄰近國家如日韓、東南亞語系的語言資料庫,讓台灣擁有不可取代的競爭力。
台灣杉二號的算力有多厲害呢?它能在一小時內讀完4千5百萬字,相當於一整部大英百科全書,且不同於Open AI,它主打「客製化的商用AI」,利用企業內部資料,優化專業能力,打造具隱私性、高保密度的環境,這也讓法律、醫療領域的企業,才敢使用生成式AI。
我們已迎來AI的iPhone時刻,人類想像中的AI終於來到,但台灣在AI發展的優勢是什麼?生成式AI引爆的生產力革命如何應用在產業面?本集節目邀請吳漢章,用專業角度帶我們領略「AI2.0」的發展及應用。請收聽「新聞真假掰 」,假訊息Bye Bye。
吳漢章(華碩雲端總經理,以下簡稱「吳」)
黃兆徽(台灣事實查核教育基金會董事/台大新聞所兼任助理教授,以下簡稱「黃」)
📅節目預告
2023/08/27 周日 17:05-18:00 全台皆可收聽(查閱各地收聽頻率)
生成式AI 引爆生產力革命的創新應用有哪些?奠基於「台灣杉二號」,台灣版ChatGPT優勢何在?
專訪吳漢章 台智雲總經理
🌐最新精彩內容
海角七號、賽德克巴萊、KANO⋯魏德聖談創作心路,竟曾一度想不開?如何從癌童故事重獲生命力量與希望?
------------------------------------------------------------------------------------------------------------------------
黃:哈囉大家好,我是兆徽,歡迎來到新聞真假掰,今天來到現場陪伴我們一起提升科技資訊與媒體素養的好朋友是華碩雲端暨台智雲總經理吳漢章,漢章好。
吳:兆徽好,大家好。
黃:漢章其實我們是臺大同一屆的同學,但是漢章在這個AI、雲端的資歷非常非常的深喔,那早在這一波生成式AI大爆發之前,其實漢章從學生時代就一直在投注在AI相關、雲端相關的研究,對不對?
吳:您是臺大電機系畢業,然後博士班就是讀臺大電機的醫工組,甚至在2000年的時候就自己創業過了,當時創業就是跟AI雲端有關嗎?
吳:當初創業就是1999年的時候有一波達康熱潮。
黃:是是是。
吳:所以那時候很多互聯網的概念都希望用到這些數位科技了,所以我那時候因為我的背景是做醫學工程,所以就很希望利用這些網際網路的技術來用在這些高血壓、糖尿病的這些照護,所以那個時候是從這個角度去做切入。
黃:是,去年11月的時候,生成式AIChatGPT推出喔,短短二個月就有上億人註冊,全球就引爆了一波生成AI的浪潮。
黃:那我們很高興聽到今年5月的時候,臺灣也有了自己的ChatGPT喔,就是臺灣杉二號超級電腦,然後它的參數也高達了1760億個,其實是跟ChatGPT3.5同級的,對不對?叫作福爾摩沙的這個大模型。
黃:所以今天就特別邀請到漢章來跟我們分享一下,這個臺灣版的ChatGPT福爾摩沙大模型,到底為什麼我們要做這個?然後它的厲害在哪裡?那為什麼臺灣需要訓練一個自己的ChatGPT?
黃:那臺灣的機會又在哪裡?及在產業上我們怎麼應用?我們先來談談這個臺灣杉二號的超級電腦,福爾摩沙大模型它厲害在哪裡?
吳:對,臺灣杉二號是科技部在2018年,那時候國家有160億去投入在AI計畫,裡面有50億元就來建AI超級電腦,那為什麼特別叫AI超級電腦?它跟我們以前認識的超級電腦其實也不一樣。
黃:怎麼樣的不一樣?
吳:超級電腦其實就是有很多電腦或很多CPU組成,它的運算力特別強的一個系統,過去的超級電腦主要是用在學術研究,物理啊、模擬啊、這個天氣預測啊等等,那在AI整個AlphaGo出來,大家都覺得AI更重要以後。
黃:對,因為AlphaGo它可以下贏人類的圍棋冠軍。
吳:對,就覺得很厲害嘛,所以大家16年這個最近的一波AI浪潮出來以後,那大家都知道AI會是人類很重要的一步啦,所以那時候就科技部就覺得,我這個AI需要算力,那我們要前瞻來看。
吳:所以我們就要投一個很大算力,專門給AI用的超級電腦,那給藥AI用的超級腦跟一般的超級腦不一樣的地方就是,它用了GPU加速,如果各位對於股票很在意,最近這一波漲的就是所謂的AI伺服器,漲的就是AI超級電腦,其它需要很多AI伺服器加總在一起,才有辦法提供這麼大的算力。
吳:所以臺灣杉二號可以說是,那時候科技部很前瞻的一個思維,就是大家都還不一定看得懂為什麼AI需要這麼大算力,它就先建了一個那時候全球排名第二十大的超級電腦,這很厲害。
吳:因為全球每年都有很多超級電腦跑到這個世界上,那過去在前百大幾乎都是美國、中國大陸。
黃:而且都是大科技公司。
吳:不是,是國家在投。
黃:都是國家。
吳:國家在投,所以臺灣在2018年能夠有排名第二十那很棒,而且這個超級電腦是專門給AI用。
黃:這已經算是有一點點超前部署。
吳:超前部署的確,這個超前部署就會反應在我們這一波ChatGPT,讓它出來,ChatGPT我們換一個詞它是生成式AI,或是再換一個詞它即所謂的AI2.0。
黃:AI2.0?
吳:什麼叫AI2.0呢?就是各位在過去幾年都看到很多人臉辨識啊、車牌辨識啊、影像辨識的這種AI,這種AI我們叫1.0。
吳:這種AI它也會需要算力,但算力就是跟我們這一波生成式AI所需要的算力,可能差1萬倍、10萬倍,那ChatGPT各位都玩過,覺得它很厲害,那稍微破解。
黃:所以1.0它只是會辨識?
吳:好,1.0我們叫做決策性AI,它就告訴你這個是男生、女生、狗啊、貓啊,是不是你這個人?辨識嘛,那2.0就是生成式AI可以幫你寫文章。
黃:它可以生成。
吳:可以生成,可以幫你翻譯,可以幫你出作品等等,就它更接近人的腦袋,所以我們都會感覺,哇好像可以取代人。
黃:對,就是以前我們會說人腦它的優勢在於會創作,可當生成式AI出來之後,到底什麼叫創作?
吳:對,就是決策型AI它只會告訴你對不對,生成式AI才能真得幫你取代你做事嘛。
黃:對,是。
吳:所以這一波生成式AI就讓大家覺得,好像真的可以幫我做很多事,可以提升我的生產力,也有人說生產力革命等等,這麼厲害的AI表現,它背後其實是很大的AI的這個模型量的提升。
吳:那剛剛您有提到我們現在是一兩千億個參數的模型,這大家可以想像,AI就像人的腦袋,一千多億個參數就有點像是一千多億個神經元。
吳:所以AI2.0是這麼大的腦袋,那AI1.0可能是幾百個、幾千個神經元,所以你看一千跟一千億只差一億倍嘛。
黃:那這麼大的腦袋,你要去讓它做好訓練,那你就要遠大於過去AI1.0的算力,那這個算力的多寡或有無就會決定可不可以參與這一波AI2.0的浪潮。
黃:算力我們可不可以用一些比較淺顯的方式讓聽眾朋友聽得懂?
吳:算力就是,簡單來講就是你。
黃:可以算多快?
吳:就多快,對,所以像我們現在像一般的電腦,你可能每一秒鐘可能做幾千萬筆運算,那如果在超級電腦,你可能就是幾百億筆運算。
吳:就是同樣時間,你可以做多少運算就代表它的計算能力嘛,所以我們叫算力,那超級電腦本來就是,幾百臺電腦或幾千臺電腦的總成,那AI超級電腦就是用GPU加速器再多提升了幾百倍。
吳:所以它的算力就很驚人,那也有這麼大的算力,才有辦法去把像ChatGPT這樣子的生成式AI做出來,我們也才能感覺到,它好像跟人一樣聰明,甚至有的時候比我們還厲害的感覺。
黃:所以這個ChatGPT啊,也就是我們的臺灣杉二號,它其實說有1760億個參數,這樣的超級電腦它是非常大臺嗎?還是其實都可以在雲端?
吳:這個跟您補充一下,不管是ChatGPT或是我們在臺灣做的福爾摩沙大模型,它在一千多億個參數指的是它的模型的參數量。
吳:那超級電腦就是一套系統,你有給它一個這個計算的工作,它可以把它計算出來,那超級電腦本身,以臺灣杉二號來看,可能就是大概30坪左右的房間,然後幾百臺機器所兜起來的一個電腦。
黃:是,就是大概30坪的房間容納1760億個參數。
吳:不是,1760億個參數指的是這個模型,超級電腦就是電腦這是兩回事,對對對對,只是我們想要做像ChatGPT這種大語言,就是這種生成式AI要這麼厲害的AI,你會需要厲害的電腦。
黃:龐大的計算能力。
吳:所以你會需要很大的電腦,所以電腦是去作出AI的。
黃:這些參數。
吳:對對對對。
黃:是,然後它需要的空間,如果我們想像一下就是30坪。
吳:對,就是我們各位其實在以前在電影裡面,都會看到很大的機房裡面放很多電腦,其實超級電腦大概就是那個感覺,它不是你桌上或是辦公室看到的那一、二臺電腦,對。
黃:是,那我們為什麼要做臺灣杉二號?
吳:臺灣杉二號就是提供算力嘛,所以你可以說科技部那時候就是想得比較前瞻,就是你國家。
黃:它有預期到AI未來會是。
吳:國家不管是參與什麼AI的研發,比如說。
黃:背後都要有算力來支持。
吳:要不然你連做都不能做。
黃:是。
吳:那在這一波ChatGPT就更明顯了,ChatGPT它的技術我們叫大語言模型嘛,所以你不管是學校老師,或是新創,或是像華碩這種想要投入大語言模型研發的人,你沒有算力,是都動不了。
吳:所以還好國家那時候有投,這個臺灣衫二號的超級電腦,所以像我們才有機會利用當初建這個算力,來參與這一波AI2.0的浪潮,對。
吳:所以你可以說在以前高速公路在建的時候,都沒有車在走,那時候說今天不建明天會後悔,其實超級電腦那時候也是,如過2018那時候沒建,臺灣這一波都只能當用戶。
吳:但我們現在有算力,所以臺灣的軟體人才,或是華碩這樣的公司才有機會參與這一次的這麼大的一個浪潮。
黃:對,所以因為我們有超前部署了這個曾經是全世界前20名的臺灣杉二號超級電腦,所以我們這次可以很快地,其實應該也不是很快,只是我們以為說是ChatGPT開始才開始。
吳:我們算是從,如果我們不看中國大陸,如果以從日本到東南亞,亞洲這一條,臺灣應該是最快能夠作出一個這種夠份量的大語言模型的國家。
黃:我們大概投入了多少時間來做出這個福爾摩沙大模型?
吳:台智雲在做這個福爾摩沙大模型大概用了市價大概二億左右的算力。
黃:就做出來了。
吳:誒二億的算力很大,然後我們大概投了五十個工程師,花了大概半年的時間,對,所以它本身還是一個很需要研發人力的投入。
黃:所以我們真的是ChatGPT出來之後,我們才決定趕快來做一個臺灣版的ChatGPT?
吳:因為killerapp出來了嘛,你在沒有ChatGPT之前,誰會關心大語言模型?各位可能想都沒想過。
黃:所以我們用半年就做出來,那真的是很迅速喔。
吳:還好我們有算力,我覺得重點還是在。
黃:有我們的基礎建設。
吳:對對,沒有這個基礎建設,我們有想法也不會有作法。
黃:LLM大型語言模型ChatGPT已經這麼厲害了,為什麼臺灣要有自己的福爾摩沙?
吳:這個ChatGPT的這個Chat就是一種應用模式啦,就是每個人都可以去ChatGPT做他想做的事情,所以對於一般消費應用沒有問題,但今天如果你是要金融、醫療、國防、法律。
黃:就是要比較精準的?
吳:就是這些比較企業級,或是比較垂直領域去應用,那這種通用型的ChatGPT,跟你想要在垂直領域做得比較準、比較深、比較新,或者是你對於它的生成的掌握度要比較高,或者是你這個模型,你希望能夠放在你可以信賴的地點。
吳:比如說像現在ChatGPT各位知道它其實都在北美洲運算,那今天有些領域它可能會希望,它不要離開臺灣,甚至不要離開我這個公司,那你就要有更多選擇去讓User企業用戶去有它比較能信賴。
黃:確保這個資料的隱私。
吳:對,這資料隱私是一個嘛,那再來就是安全性啊、成本啊,還有在就是深度,因為ChatGPT它是一個大家通用模型,所以所有人一方面在幫助它更厲害。
吳:一方面也都是用同一個腦袋取得一樣的結果,那今天如果你這個醫院想要放一些自己的資料,讓這顆模型更懂,那你是沒有辦法的,所以ChatGPT你可以想像,它就是現在最厲害。
吳:但它是一個通用,大家都有辦法access,但今天如果你要企業用特別的,你就要用回到大語言模型,你要自己能夠作出一個,那這個就會是ChatGPT以外人的機會。
黃:所以我們的這個臺灣杉二號為基礎模型,打造出來的福爾摩沙大模型。
吳:對,我舉個例子像。
黃:其實大型的LLM,它是可以量身符合企業需求?
吳:這個就是因為我們知道ChatGPT現在是最厲害,所以我們嚴格來講,我們不會說我們在做一個ChatGPT,而是我們要去讓企業應用,或是需要有自己掌握力的應用,有辦法自己也做一個出來。
吳:所以譬如說我們現在在幫醫院去做一顆醫院的大腦,那醫院如果從無到有去做一個模型訓練,它可能要花500萬美金、600萬美金,其實很貴嘛。
吳:所以像台智雲這種公司它就會先利用它的算力先去作出一個基礎模型,所以我們就叫做福爾摩沙大模型。
吳:那醫院只要再加上自己的資料做一些優化,它就可以再取得一個自己的模型,它自己的大腦。
吳:像這種作法就是我們講企業級的大型語言模型,那就是除了ChatGPT以外,很多其他不管是世界各地的新創或是科技公司目前的機會。
黃:不過因為ChatGPT其實現在也蠻多人在用來量身改造成自己公司可用的語言模型,那它跟這個福爾摩沙大模型的差別又是什麼?
吳:ChatGPT它能夠給的彈性比較小,其實倒不是技術問題啦,就是如果你去看OpenAI他們的一些演講。
吳:他們相信的是一個所有人都連上來的一個大通用模型,所以這個模型會越來越厲害,跟著它的用戶一起成長,所以。
黃:但是它相對的資料讓AI學到的資料其實非常地複雜,真假難辨對不對?
吳:你可以說因為通用,因為你什麼資料灌過來。
黃:都變成它的資料庫。
吳:這是一種考量,但另一種考量就是,你希望針對特定領域讓它學的比較深,你就需要去動到這個模型自己的參數。
吳:這件事情跟它要做一個大通用模型有邏輯上會牴觸,所以我想要通用,我就只能讓大家做很有限度的的調整,我才有辦法保持這個通用,但今天如果這個大型客戶他要做比較深的、比較聰明,或是比較貼近自己領域的。
黃:客製化。
吳:客製化,那就需要有別的作法,所很多客戶在告訴,我們他們其實也都試著用ChatGPT或是用OpenAI,HOpenAI去做他們要的那種優化,但其實都只能做到一點點,他們沒有辦法做到更深。
黃:這跟這個ChatGPT的訓練資料裡面,其實中文資料只佔很少部分,繁體中文資料佔好像百分之零點幾而已。
吳:對對。
黃:是不是也有關係?
吳:這也是另外一個考量了,就是因為它當這個通用模型,不是一個國家通,它是全世界通用,對不對?
吳:所以全世界它如果它的用戶英文為主,它當然就是會在英文比較多著力,那中文裡面搞不好它在簡中做的努力還比繁中多。
吳:因為繁中就臺灣跟香港在用嘛,所以也可以理解啦,就它今天要維持這個全世界是一個通用模型,它就必須要做選擇。
吳:是,所以今天不只是我們,比如說你要在東南亞特定國家,你要基於ChatGPT或OpenAI去做你所需要的往上面加值或優化,都會碰到你剛剛講的它本地語言,當初讀的知識沒有這麼多。
吳:所以我舉個例子像早期如果你去看,去問ChatGPT108課綱在臺灣很多人關心嘛,對不對?你去問它108課綱,它回你的會是大陸的108課綱。
黃:是。
吳:那你就會講,因為今天我在臺灣,要提供這種服務給我們的親師生,結果回的不是臺灣的知識,那當然大家就會覺得好像可以再改變一點嘛,對。
吳:所以但ChatGPT你沒有辦法影響它要往哪裡學,因為它是一個大通用模型。
黃:大型通用、全球為範圍。
吳:對對對,所以你一定會在一些領域,或是一些比較本地優先的應用,或是你希望它的正確性比較可信賴的,你就會有要有自己模型的企圖心。
吳:但你一旦想要自己模型企圖心,你就要有這個算力,你要有這個基礎,你要有這個資料去做訓練,那這就會有難度,但反過來就是我們的機會。
黃:是,我們都說算力就是國力,尤其在生成式AI大爆發的年代,所以這個當時的臺灣杉二號超級電腦奠定了我們的國力,就是在發展AI產業。
吳:我們有話語權,這倒也不是我們,我們自己好像覺得自己很厲害而已,其實我們過去半年在東南亞幾個國家在走,他們都對於我們的算力非常有興趣,因為他們只要想做越南的。
黃:ChatGPT?
吳:要做泰文的,要說印尼文的,都會碰到一樣的問題,就是他們沒有算力,他們有資料但沒有算力。
吳:所以像我們馬上會跟其中一個國家去簽一個策略合作,就是我們也有機會利用我們的算力去進入那個國家。
黃:去幫他們訓練他們的。
吳:對,但這個就不是純粹幫,因為我跟它合作以後,它再往下長的應用,我都有話語權。
吳:所以這就臺灣的軟實力,可以藉由這次算力即國力的一個前提,我們有機會去幫助我們周圍的國家,我們也有辦法去有擴大我們的市場的一個機會。
黃:是,所以基於這個臺灣杉二號超級電腦奠定了這個算力的及國力的基礎,所以我們臺灣這個第一個1760億參數的福爾摩沙大模型,所以它這個裡面我們的訓練資料是不是都是以臺灣的為主?
吳:當然不只,當然我們繁中的比例可以拉到可能10幾20%。
黃:繁體中文的資料裡面有10幾20%。
吳:因為我們可以控制嘛,我們就讓它多學一點,我們想讓它學的,少一點我們不想讓它學的,但我們還是讓它兼顧,它還是英文能力要好、日文能力要好,幾個東南亞國家語言,原來我們才有辦法基於這個,我們自己可以掌握的大語言模型去做生意。
黃:是,所以這個福爾摩沙大模型,根據你們這樣五月中推出到現在,這幾個月的應用起來,在哪些上面是真的有優勢?比起ChatGPT?
吳:因為我們在探索的就不是消費型的應用,而是大型企業它想要利用這一波生成式AI來做,所以我們大概累積了15個不同的行業,大概快一百個usecase。
黃:哪15個行業?
吳:比如說您最熟悉的媒體業,媒體業跟我們講的是比如說外電編譯,外電編譯以前都用人,現在可以用生成式AI,它可以做外電往繁體中文的編譯,它也可以把它記者寫的繁體中文的內容轉成,以前可會覺得很花人力的事情,現在就覺得這個這一波生成式AI的翻譯品質太厲害,而且它的。
黃:所以這個我們有比對多過,比ChatGPT更精準?
吳:我們還是要講,我們不是要比它做得更好,因為不可能,它還是最厲害,但今天你要去做一個你想要的Vertical,這個Vertical它需要比較準,它需要有比較高可控的資料,它希望能夠放在你想放的地方。
黃:確保隱私。
吳:這件事情是ChatGPT現在並沒有提供你這個彈性,所以我們並不是去跟它比誰好誰壞,而是我們現在是讓一些沒有辦法用ChatGPT去落地的企業,可以做。
黃:是,因為據我所知一些大型的律師事務所,他們就禁止使用ChatGPT。
吳:很好,你講得很好,所以我們也有服務律師。
黃:因為也怕那個顧客的資料,覺得就變成ChatGPT的學習對象。
吳:所以那你現在想,今天律師事務所想不想用生成式AI?太想了。
黃:對,因為確實。
吳:他們的翻譯服務,擬稿服務,全部都可以用這個概念,而且。
黃:做得比人可能更好。
吳:好很多,對,所以但它的限制條件就是,它要怎麼把這個不太敢用的環境放到它敢用的環境?所以你就要有一個大語言模型,可以放在它家裡嘛。
吳:所以我們目前在臺灣做的努力就是這種,所以我們不會去比我們比ChatGPT厲害,因為不可能,它還是最厲害的,但我們可以讓。
黃:服務一些沒有辦法。
吳:沒有辦法去使用ChatGPT的,我想醫院也是,它不是想它是不能用。
黃:有病患隱私的病歷,所以您剛剛提到十五個領域都在應用,媒體是一塊,媒體現在用最多的是翻譯?
吳:翻譯是很容易想到的,那還有一些比較專業媒體會希望透過生成式AI做一些個人化的知識服務。
黃:譬如說?
吳:譬如說很多媒體其實都累積資料庫,那這個資料庫它要怎麼加值變成一個新的商業服務給它的訂閱戶?
吳:過去可能只能透過什麼關鍵字搜尋,那現在不是,現在透過生成式AI它可以變得很好查,更容易。
黃:去理解這些語意。
吳:理解,那這就是一個新的服務嘛,那這新的服務過去你要用人來做太貴。
吳:就是我們以前講什麼ChatBar這種,ChatBar是1.0時代就喊到爛了。
黃:聊天機器人。
吳:聊天機器人在1.0的技術很難做,而且效果不好,那在生成式AI就是大家感覺到的,這麼像人,而且它實際上是真的可以用很短的時間就可以到,所以這也是一個例子。
吳:但你也可以或是你也可以看到像名師去做AI主播,這也是一個例子,或者是有些。
黃:AI主播跟這個大型語言模型的關聯是什麼?
吳:AI主播它的形象背後要一顆腦袋,那顆腦袋還是生成式AI,只是你再多把那個形象做出來,就變AI主播。
吳:所以,反正媒體、律師事務所你剛剛提到嘛,那製造業我們聽到很普遍的是,他們希望利用這一波生成式AI把他們過去累積很多的這些文件變成是他的員工好用的知識,因為每個企業其實都很多文件,各位每年都在寫文件,然後找的時候。
黃:常常是人離職就什麼都找不到了,對不對?經驗跟知識無法傳承,也找不到在哪裡。
吳:對,或者是你自己的文件其實你也找不到,但你一定有印象,你很想要拿來複製。
黃:那AI可以怎麼協助?
吳:那你今天用生成式AI,你就可以去做技術上我們叫語意搜尋。
吳:你就可以把你過去累積的幾千份文件,依照你想要找到的資料,它就可以幫你把那個文件的那一段內容找出來,那你就可以容易複製剪貼。
黃:所以它是個比關鍵字更好用的,對不對?因為它是去理解。
吳:對,所以我們叫語意嘛,關鍵字搜尋是相對簡單。
黃:因為關鍵字要有一模一樣的字,它才找得到對不對?
吳:那你就不一定查得對啊,那語音搜尋就是有一個範圍嘛。
黃:它會去理解這過句子在講什麼,所以你可以換句話說,它也找得到。
吳:對對,那這個對於製造業,對他們跟我們的feedback是它會對於他們長期以來的人員訓練問題,好像可以有一個很好的解決,因為他們有很多都是重複性的訓練工作,譬如說像華碩為例。
黃:是。
吳:我們常常都有新的產品,這新的產品我們的同仁要去尋找做proposal等等。
吳:就是在很多很雜亂的資料裡面去尋找嘛,那對人來講我找不到或找得很累,我就用不好這些知識,但那個知識其實對公司來講。
黃:是很重要的資產。
吳:很重要的知識啊,所以我要怎麼樣讓公司隨著時間、隨著人累積的知識,讓每個人。
黃:都可以輕易的。
吳:被賦能嘛,所以它一定可以幫助,其實不只製造業啦,各行各業在運用公司長期累積的知識,會有一次生產力的提升,這也是一個例子。
黃:好,我們先休息一下,待會下個階段我們繼續來聊聊這個ChatGPT,尤其是臺灣版的福爾摩沙大模型,目前已經應用在哪些層面,我們先幫聽眾朋友點一首歌好不好?
吳:點一首歌,好啊,這個我剛剛想了一下事實查核,就是我想到一個英文歌叫Can'ttakeeyesoffyou
黃:Can'ttakemyeyesoffyou,好,我們來聽聽這首Can'ttakemyeyesoffyou。
黃:漢章剛剛跟我們分享了這個台智雲在今年5月的時候宣佈了透過臺灣杉二號超級電腦建立出臺灣第一個高達1760億參數的福爾摩沙大模型。
黃:就是在這個年代,電腦運算的算力就等同於國力,那還好臺灣在之前就有超前部署,建立了這個臺灣杉二號的超級電腦,曾經是全球前二十大的超級電腦,就很有這樣的遠見。
黃:所以在這一波生成式AI爆發之後,我們在ChatGPT出來一推出,我們馬上也就投入建立臺灣版的ChatGPT就這個福爾摩沙大模型。
黃:那漢章也跟我們分享了為什麼我們需要建一個臺灣自己的ChatGPT,臺灣版的ChatGPT福爾摩沙大模型,因為ChatGPT它的服務畢竟還是比較通用型的,面對全球。
吳:比較消費者。
黃:對,那它的繁體中文的資料相對是非常少的喔,百分之零點幾我記得,那在我們的福爾摩沙大模型裡面繁體中文的資料佔到10幾到20%,所以可能更符合臺灣人的需求。
黃:同時也可以解決有些公司注重隱私啦,不敢使用一個通用型的全球的模型,擔心自己的資料可能就會變成別人。
吳:別人的一部分。
黃:對,很容易就取得的資料,因為其實ChatGPT大家也都有各種運用方式,騙它說出一些密碼,所以確實我們也需要為企業量身打造企業專屬的語言模型。
黃:剛剛漢章有跟我們介紹了在媒體界有一些應用,在製造業有一些應用,那您有提到說目前有十五個領域都有運用了這個福爾摩沙大模型,還有哪些領域大概怎麼用?
吳:好啊,我來聊聊我也比較熟悉的醫療領域。
黃:是,您是醫學工程的專家。
吳:醫院在這一波生成式AI,他們有一個想做很久,但終於可以做的就是可以真的幫醫生把報告自動生成這件事情做出來,各位可能有的知道,有的不知道,其實臺灣的醫生跟護士很忙碌。
黃:是。
吳:這個忙碌有一個他們每天都在花的時間就是寫各種報告。
黃:就是各種檢查的報告、各種病例、巡房的。
吳:你在看門診,他的每一件事情幾乎都要有報告。
黃:對,因為要申報健保資料,然後請領健保對不對?
吳:各種,對,那生成報告這件事情在各位可以想像,今天您在診間跟醫生對談,那你一定會覺得醫生都不太專心,因為他不斷地在打電腦,對不對?因為他就是要寫東西。
黃:他會花很多時間在記錄病例。
吳:但你的期待一定是。
黃:多跟你講話。
吳:多跟你講話,但醫生不是不想這樣,但他沒有時間。
黃:可是他申報健保資料,他就得key這麼多報告,對不對?
吳:對,所以在這一波在生成式AI,我們就有機會讓這個語音辨識加生成式AI這二個技術合在一起,就可以把一個在診間的醫病的對談先變成逐字稿,像雅婷逐字稿,逐字稿然後再把它變成一篇報告。
黃:是,就把假設透過雅婷逐字稿,現在語言轉文字的技術,然後自動把它變成報告。
吳:然後再變報告。
黃:他只要花時間跟病人交談,他的東西就會自動變成報告。
吳:對,那這個是因為每個人都多多少少有看過病,很可以理解,但在醫院裡面,類似的報告工作還有各位很多看不到。
黃:比如說?
吳:像護士每天在交班的時候,可能都要花一個小時的時間要寫各種報告。
黃:對,因為這麼多床病人,每一床到底是什麼樣的狀況他們要交接對不對?
吳:對,所以我們英文叫documentation或是report,就是這種自動寫報告這件事情是,在醫院在這一波AI非常想做,這是一個例子。
黃:還有像醫生巡房的時候,對不對?他早上主治醫師巡房,一次可能說不定要巡個幾百床。
吳:再一個例子是也會跟民眾比較息息相關的是,延續剛剛講的是醫生寫的報告嘛。
吳:那民眾其實還有另外一種需求就是,希望醫生跟我的溝通更細膩、更有耐心,可以講更多話,但一樣醫生沒有這麼多時間嘛,所以有一種應用趨勢我們叫做這個medicaltranslation,就是它可以把醫生比較。
黃:專業的用語。
吳:專業的詞比較精煉地詞,轉成一個比較白話文的報告,那對民眾來講他就會覺得。
黃:所以醫生是用講的告訴你?
吳:他不管是用講的或者是。
黃:裡面還有很多專有名詞,但是我們可以給民眾一個文字是淺顯易懂。
吳:因為醫生其實一個是沒有時間嘛,一個是醫生畢竟是專家,專家習慣會用他的專業語言去講,但民眾不是專家,所以我們常常看了一個東西還要去查Google,他這個對不對?那用生成式AI我就有機會用AI來彌補這個gap。
黃:轉譯者。
吳:轉譯,對。
黃:這個在很多科學領域都非常需要。
吳:是不是?所以這個就。
黃:以前記者啊都是最不敢採訪科學家,因為科學家就講好多。
吳:就是專家跟。
黃:然後科學家也會抱怨記者說,怎麼我講得話都被扭曲了,現在可以靠生成式AI也解決這個問題。
吳:那再一個例子就是,像臺灣的醫生也很多在做研究,那做研究的時候他就要閱讀很多新的知識,那新的知識很多來源就是各種論文嘛。
黃:對,還有各種醫學期刊。
吳:期刊,所以他要用很短的時間閱讀很多,這件事情他現在也可以透過摘要,就生成式AI的摘要能力很強,這個各位可能也都有經驗。
黃:對,這個真的很厲害,你把一篇幾萬字的英文paper扔給它。
吳:大家都有,那你甚至還可以跟這個文件對談,就是你想要看生也很容易,就像我們以前做研究的時候,看論文是很痛苦的,那現在不只是電子化,而且它還幫我先整理。
黃:翻譯成中文,然後重點摘要。
吳:還可以翻譯,多好,我懶得查字典,它還可以幫我翻譯,所以我去吸收知識變得更快速,但醫生不需要翻譯啦,但他。
黃:有效率獲取知識。
吳:效率,對,或者是像我們在做研究的時候,我們常常對於一個新的主題要去瞭解,或是要去做很多探索,那過去這種探索我就只能自問自答去找paper,或是去請老師,找老師或是找一些外面的同業去交流。
吳:那我現在可以跟生成式AIChatGPT交流,因為我可以跟它對談嘛,所以它又是通用知識的一個總成,所以它幾乎可以跟我聊我的idea,越聊越細,可以幫助我去做一些研究的題目的發想,這個也很重要,那當然再一個就是我真正在寫我的研究論文的時候,這個就像。
黃:可以怎麼用?寫論文的時候可以怎麼用生成式AI?
吳:那就跟我們寫文章啊,因為生成式AI可以寫新聞稿,可以寫很多嘛,但在醫療領域寫這種醫療論文的時候,那這個就是。
黃:精準度更要求。
吳:或者是會有些ethical就是倫理上面的,所以這個就會是不同行業有不同的考量啦,我想行銷界大家可能不會。
黃:對,文案就越活潑越好這樣。
吳:但你看像我剛剛看新聞說,那個美國的這個演藝工會都罷工了啊。
黃:因為他們。
吳:他們的工作被AI取代了。
黃:之前是編劇罷工。
吳:以前寫劇本是人寫,現在可以用AI寫對不對?所以你看這剛剛我看到這個新聞,所以不同行業可能對於這種就還有不同的倫理議題。
吳:這是後話,這是社會的變遷,所以你看光一個醫療領域就有很多,各種應用,而且會越發覺越多。
黃:是,對,您剛剛提到這些其實都是在協助人類的工作做得更好,跟好萊塢的這個編劇的大罷工,他們擔心自己的工作被取代,其實中間還是不太一樣。
吳:這個就是,就是到底AI是取代人?還是輔助人?那我覺得這一波,我覺得取代還很早啦,因為大家的感覺都是因為有生成式AI讓自己變得更厲害,生產力提升嘛,所以但你難免會有我原來要請十個人,我可不可以只請八個人?
吳:雖然不會不請人,但我覺得也還好,因為我們同時也在面對各種缺人或是少子化的事情,所以我覺得這也有可能。
黃:大家都在缺工。
吳:對,所以你把它積極來看,它可能是可以幫助大家往下一步走的一個解法,對不對?你要讓那麼多人短時間之內要會很多技術不容易,但如果你生成式AI幫助你,你可能就比較敢去進入一個新的領域。
黃:是,然後可以把人力放在更。
吳:更對的地方,所以我們就從積極來看,它就是生產力往更有價值的地方走。
黃:對,是,您剛也提到醫療領域的應用,那這十五個領域還有什麼用的很好?
吳:好啊,我再講一個也蠻普遍的就是客服。
黃:客服?智慧客服。
吳:智慧客服,那因為智慧客服本來就用各位聽很多的這個對談機器人就用很多,那過去的對談機器人就是,它要寫很多規則,然後它的自然語言。
黃:給它很多考古題這樣子?
吳:因爲過去的AI技術,你會需要告訴它問題要怎麼回答這件事情?你要寫很多規則,那這個規則還要再加上一點自然語言處理去把它,所以你要去做一個客服系統,你要花很多人力去編寫它背後的講腳本好了。
吳:但這一波生成式AI,因為它的理解能力很強,所以我就可以不用過去這麼多的寫腳本的工作,我就可以來利用這個對談能力來降低我客服人力的投入,所以客服其實就會在零售業、金融業、電信業普遍都會看到。
黃:是,而且現在語音轉文字、文字轉語音的技術越來越純熟,它已經不只是,現在有很多客服是要打字的,接下來就可以用對話,可以用自然語言跟它講。
吳:對,所以客戶服務這也是一個剛需。
黃:是是。
吳:再一個像教育領域也很多,這邊教育電臺嘛。
黃:教育領域目前哪些用得很好?
吳:幫老師出考題啊。
黃:怎麼幫老師出考題?老師要給它哪些資料?
吳:這個就看領域啦,看你是比較專業的,還是國高中這種,大家也在累積經驗,但出考題這件事情,我們以前也當過助教啊,就出考題本身是個花腦袋的事情,那現在有人給我的大部分,我只要微調就好。
黃:怎麼用啊?出考題可以怎麼的用法?
吳:怎麼用法啊,你就給它一個範圍讓它請它幫你生成選擇題這種。
黃:你直接給它一篇課文,叫它直接幫我出五題選擇題。
吳:對對對對對對,因為其實生成式AI要講回技術,生成式AI它是一個大型語言模型,配合很多不同的任務。
吳:這個任務譬如說翻譯是一個任務,寫文章是一個任務,不同的任務像寫程式是一個任務,不同的任務你就要再做一點比較優化的訓練,概念是這樣。
吳:就是我做一個比喻一樣是教育電臺嘛,在這一波生成式AI它就像我們訓練一個專家一樣,你如果訓練一個專家,你要從3歲小孩訓練,你要花太久時間,這不makesense。
吳:所以你會希望先去找一個很聰明的大學生,然後再加上專家的訓練,所以很聰明的大學生其實就是飽讀群書的那個部分,很花算力的。
吳:那專家進來就是告訴它,我今天要教你寫程式,要教你寫作、翻譯,要讓你學考題,你要去做這個領域的優化訓練,所以出考題也是一種任務。
吳:所以今天這個大型語言模型生成式AI,我可以讓它再補強一些出考題的能力以後,它就更能夠幫助。
黃:所以這個實務上怎麼用啊?就是說您有提到,我們現在這個福爾摩沙大型的語言模型,因為有更多繁中的資料,更多臺灣的資料,而且它更可以量身符合企業的需求,那我們是怎麼樣訓練一顆企業專屬的大腦?
吳:好,我們這個在不同客戶的經驗都是這樣,福爾摩沙大模型就像那個很聰明的大學生,所以我們讓我們的客戶先去訂閱一個它,就是它可以訂閱這個大學生。
黃:先招募了一個大學生。
吳:對對對,那這個叫基礎模型嘛,我們叫福爾摩沙大模型,然後它可以再加上他自己的資料,來當作所謂的專家訓練。
吳:那所謂的自己的資料可能是一億個字,二億個字,比如說以你剛剛講的律師,你熟嘛。
黃:對。
吳:它有可能很多新的判例。
黃:或它以前寫過的所有訴狀都扔進來。
吳:文件,那這些可能internet上找不到啊,這個是我律師事務所才有的資料嘛,所以我就可以把這一億個文字、二億個文字再餵進去,做所謂專家訓練。
吳:那這專家訓練就不用太久時間,像我們現在提供的產品是,訓練4500萬個字只要一個小時。
黃:一個小時它可以。
吳:就把它讀完。
黃:讀懂4500萬個字。
吳:4500萬個字不知道大家有沒有概念?就是一整套大英百科全書也差不多4500萬字。
黃:是,一個小時。
吳:單純就是所謂算力很重要啦。
黃:就是一個小時內,我們這個臺灣杉二號超級電腦就可以讀完了。
吳:你就可以做所謂的專家訓練,所以今天你就算有2億個文字,看起來很多,你可能就一個晚上就訓練完了。
黃:所以現在你們提供的這個套組裡面,企業可以自己把這些資料餵進去?
吳:對。
黃:所以也不用擔心說,我要把資料交給誰。
吳:對對對,而且訓練完以後的這個專家,你可以放在。
黃:你自己的企業的裡面。
吳:你自己的地方,你就不用擔心你在用的過程中資料跑到。
黃:有誰偷看到,比如說大型律師事務所可能擔心說哇裡面有很重要的。
吳:我的客戶的高保密度的資料。
黃:對,可能有很多大金融集團、大企業家的。
吳:我是不可能有任何風險。
黃:對,是是是,所以它就可以藉由這樣的模組,來訓練自己這個企業專區的大腦。
吳:對。
黃:是是是。
吳:所以這個就會,所以我們也可以說這種叫做businessGPT,商用的GPT,那ChatGPT是民眾用的嘛。
黃:是。
吳:所以其實它還是最厲害,因為它是這個最早做,而且它的算力也最大。
黃:是,所以我們在訓練一顆企業專屬的大腦裡面,它有幾個其實還蠻重大的挑戰對不對?它是包括說它要建立一個能力很完備的、欲訓練模型庫?
吳:欲訓練模型就會是台智雲先做,就是剛剛講的。
黃:就是福爾摩沙大模型嗎?
吳:對,它就是那個學生那個學生嘛,那個大學生。
黃:就是我們已經做好的福爾摩沙大模型。
吳:對,因為那大學生就是可以Clone,叫克隆,就是每個客戶都只要有同一個厲害的大學生當基礎,我再加上我自己的。
黃:有一個通才。
吳:對,我們先訂閱一個通才,再加上自己的資料就可以一個專才。
黃:所以那第二步呢?就是要優化這個模型?
吳:優化就是把它訓練成專才,就像我剛剛講。
黃:要輸入自己企業專屬的一些隱密的資料。
吳:對,那一億個資料或是對醫院來講我的病歷,就可以把它放進去。
黃:那還有第三個步驟的挑戰?安全性?
吳:對,第三個步驟就是你要把這顆優化完的腦放在哪裡?
黃:所以它也是可以放在企業內部?
吳:對,這個是我們。
黃:它需要很大的雲端。
吳:這就是我們做的努力,我們現在為什麼一定要有自主技術?是因為我們就有自主的選擇權,可以讓一顆類似GPT3.5這種能力的企業專屬的模型,放在一臺GPU的伺服器上,那這是我們做的努力。
黃:所以它只需要一個小小的空間。
吳:也沒有那麼小啦,但還是一臺GPUserver就可以,你就不需要一臺大的超級電腦。
黃:這個30坪的。
吳:對對對。
黃:ok,好,所以這個是我們要可以贏過ChatGPT的地方嗎?打造企業專屬。
吳:就是我還是講它還是最厲害,而且它在通才上它就是theone,真的跟它比的是像Google的那個Bard,或者是馬斯克現在在搞的,但世界不是只有一個啊。
吳:其實有一個比喻各位可以參考一下,OpenAI或是ChatGPT就有點像是iPhone,它是一個,OpenAI其實是不open的,它是一個所有技術都封閉進來。
黃:為什麼?它以前創立的時候希望open,但是後來。
吳:所以妳知道後來馬斯克為什麼離開這個原因嘛,它現在是很商業導向,它其實不再open它的technology,所以OpenAI不open,但它是有點像iPhone做得最好,但它的生態很封閉。
吳:那相對於iOS,iPhone,各位想到的就會是安卓,安卓就是都open,那都open它就可以讓各行各業,或是各個科技公司都可以找到一個自己可以加值的點,那生態就會比較豐富。
吳:可以更快速地去面對各種百花齊放的應用,譬如說就像手機,手機長什麼樣子,iOS就是蘋果說了算,對不對?我們有什麼想法都只能當客戶。
吳:但安卓不是啊,安卓是你可以,你可以baseon安卓去做你想要的各種手機的樣子。
黃:所以我們的這個福爾摩沙大模型。
吳:就有點像安卓,對,我們是做Androidlike的生成式AI。
黃:所以其他的企業,假設其他的AI研究單位,或者是其他國家的AI研究單位也可以對接這個技術?
吳:當然當然,所以就會開放嘛,開放也不一定只有我們。
黃:就是您說的它一樣可以聘用這個大學生,去改造成它想要的。
吳:但ChatGPT就沒有開放你訂閱它的大學生這件事,你只能用它這個通用的大這個大專才,但這個大專才沒有那麼專業,因為它就要兼顧通用。
黃:是是是,所以就是我們可能福爾摩沙大模型的競爭優勢。
吳:對,它其實是價值體系的差異,沒有對錯,你看你講手機的體驗還是iPhone最好,但Android的市場量很大啊,因為你不會每個客戶都只有一種需求。
黃:是,您提到iPhone,這個黃仁勳也說,現在是AI的iPhone時刻,您認同這句話嗎?
吳:當然啊,其實這件事情這很簡單,我們剛剛講到AI2.0,AI2.0相對就是1.0,就是各位在16年看到AlphaGo,到2020年2021年其實你已經覺得AI好像沒有那麼厲害了。
吳:就是你以為的AI其實都看不到,那AI都是在一些這個一些比較決策性的地方去看到,但你想像說AI是要能夠取代你的腦袋啊,所以AI2.0你終於看到你想像中的AI是長這個樣子。
吳:那為什麼說這叫iPhone時代,各位回想一下智慧型手機,智慧型手機出來的時候,不是iPhone才出來,智慧型手機在2000年那時候windowsphone、Symbian。
黃:Nokia啦這些。
吳:對不對Nokia,黑莓機,對,那到大家看到iPhone才覺得,髒話罵出來,這個才是我要的那種感覺,就是我已經講了這麼久,你終於給我一個比我想得還好的。
吳:其實這一波ChatGPT給各位的感覺,我不知道是不是?你已經了解AI這麼久,你已經接觸AI這個詞這麼久,但你終於看到你想要的AI。
黃:是是,以前覺得AI很遙遠對不對?現在非常貼近我們的生活。
吳:貼近,而且它好像真的比你想的那麼厲害還更厲害。
黃:而且它的能力其實還不斷地在被開發中。
吳:所以你看智慧型手機這麼久到iPhone出來,大家知道這就是他要的,整個我們講行動互聯網或手機的這個產業是爆發的,就是在2007年iPhone出來以後,08、09、10整個手機產業是換了一個樣子。
吳:然後所有人的應用,我不知道各位還記不記得沒有手機的時候,沒有智慧型手機的時候,大家是要用msn。
黃:對,我們現在都已經很難想像其實我們的大學時代沒有手機,我現在都已經很難想像,我們當時在約人的時候怎麼約?大家先用市話約好在哪裡這樣。
吳:所以我才說,所以為什麼他講說iPhonemoment就是它非常符合大家在iPhone出來前後,在智慧型手機或mobile大家的體驗。
吳:那這一波ChatGPT出來,它是AI的iPhone,所以一種層次是你終於看到你要的AI,第二個層次是你就更敢去做各種AI的應用的投資。
吳:所以過去大家沒有把它落地的應用,現在可以落地了,然後你整個產業鏈會做一次很大的轉移。
黃:是,而且我覺得ChatGPT很有趣,它很多功能其實是開發者沒有想像到的,對不對?
吳:這就是嘛。
黃:包括角色扮演,也是全球的上億使用者用了之後發現,原來它可以角色扮演辦得這麼好。
吳:我再舉個例子,這個健康醫療,就是你知道它可以聊天,我們現在在做的努力是讓它解決老年孤獨問題。
吳:當然你就沒有辦法陪伴,那你當然要還是要讓這顆腦袋更能夠符合老年人的期待,你真的用ChatGPT它可能某些地方會亂講,但這個應用就以前大家想得到,但覺得不會發生,但你現在敢想而且敢做。
黃:然後想辦法改善它就好了。
吳:對,那就會讓整個產業做一次提升,所以為什麼把它叫做AI的iPhone時代,有這幾層意義。
黃:是是是,您剛剛提到那些應用裡面,還有哪些非常有趣的應用?剛剛沒有提到的。
吳:還有一個應用是在商業領域裡面,我覺得非常potential的,就是各位都聽過推薦系統、預測系統,那推薦系統、預測系統在過去,因為它是所謂的數值資料、結構資料,所以它要用各種統計模型等等去做。
吳:那在這波生成式AI這個大語言模型,它不只能夠處理人所理解的語言資料,它還可以處理看起來不像語言,但其實是很有價值的時域資料或數字資料。
黃:比如說?
吳:比如說你今天去一個電商去購買東西,電商一定希望推薦你下一個你要買的嘛,這叫推薦,那推薦越準,你的體驗會越好。
黃:對,就越能打中。
吳:那我要怎麼做到一個夠準的推薦?那這是一個老題目,那過去早期用統計模型,後來用machinelearning、deeplearning,但在這一波生成式AI發現它非常準。
黃:它用什麼方式?
吳:那就是magic,就這一波生成式AI的這顆腦袋,有這麼多的參數,它就會有大家預期以外的表現,所以你看這個很有意思就是。
黃:所以它甚至有預測能力,知道,甚至叫讀心術了,知道這個人想要什麼。
吳:你可以這樣子類比,但它就是,我要講的是它不只是做你直覺覺得是這些語言的輸入、輸出,它還可以去做看起來不像語言,但也是資料的東西。
黃:它了解消費心理。
吳:對對對,那這個就很有potential啊,這種資料你可以拿來做庫存,庫存的預測這種,這種商業世界裡面這種需求很多。
黃:是是是。
吳:只是一樣嘛,就過去你要花很多的什麼資料科學家,去做出一個還可以用的模型,或許在這波生成式AI,你只要專注在餵給它足夠多的,你也不需要標記的資料,它就可以有很好的表現,只是需要算力,所以說為什麼算力在這一波。
黃:非常的重要。
吳:很重要,或者是這一波為什麼最近,這些股票漲得這樣。
黃:公司。
吳:就是大家都看懂了,就它是一個一次電腦運算的革命,就是桌上型電腦是一波,你看iPhone出來以後,智慧型手機是一波。
吳:它改變了很多人去使用資訊的模式,那這一波又是一個,那這一波它要的就不是手機,要的不是桌機,它要的是超級電腦的算力。
黃:是,而且這一波生成式AI的改變,幾乎已經是衝擊人類的各個生活的層面了。
吳:是是是。
黃:您剛剛也提到了非常多產業面,各個領域的應用了,那接下來但是我們也很好奇,那臺灣的機會在哪裡?
吳:就如果各位這個也跟我一樣先假設我們相信開放的力量,臺灣很小,但臺灣的科技能量跟彈性很高。
吳:所以今天只要一個新的,而且有量的一個變化,它是開放的,那臺灣公司都會有它能夠切入的彈性,這是我們過去從個人電腦,時代不斷地重複證明,或者是到半導體時代。
吳:你看我們創新的臺積電這種foundry的生意模式,所以今天只要你是一個有量的,而且你在垂直上可以開放的分工,那臺灣就都有機會,這是第一個點,因為這是我們最擅長的領域。
黃:是。
吳:那第二個,就是這一波我們先把它叫算力產業好了,這波算力產業如果你把它做垂直分工,它最底層就是那個算力,那這個算力的基礎還是在晶片。
黃:臺灣的電子業。
吳:對,所以我們過去的強項,也會幫到我們這一波。
黃:本來以前大家也會擔心說電子業只剩下代工,但是現在因為AI的需求。
吳:我們就就會在,就代工這件事情是我們在PC時代是代工,那我們在AI時代這個代工可能就modern代工。
吳:就像臺積電的代工跟我們過去電腦代工意義差異很大嘛,所以像我們在這一波算力產業,我們也把台智雲把自己叫做是AI的foundry。
吳:就是我們不是做一個完整應用,我們是把我們的基礎算力,跟剛剛講的這些可以訂閱的學生,把它變成一個一個客戶可以選用的,有點像半導體的製程。
吳:那有些做應用的客戶就可以很容易地挑到我要的製程,我不用傷腦筋算力,因為台智雲會幫我投資,我不用傷腦筋去訓練很貴的學生,因為台智雲會幫我投資,我就是做好我的應用。
吳:那就跟我半導體產業在30年前,臺灣創新的foundry模式以後,這些IC設計公司不用再去擔心去蓋廠,我只要關心我的客戶跟設計就好,所以我們是蠻有機會的。
吳:因為福爾摩沙它相對ChatGPT是一個更開放,因為ChatGPT是一個封閉的,它是一個垂直整合的,那福爾摩沙大模型或是因為我們只是一個例子,就是如果各位可以理解iOS跟Android的比喻,在Android我就可以有,一定有很多需求是透過開放的方式解決,那這種開放方式解決,你最底層還是要算力,那就是台智雲的機會或是臺灣的機會。
黃:是,台智雲是一個什麼樣的公司?它的前身是國網中心對不對?國家網路中心。
吳:應該說臺灣杉二號這個超級電腦,它是國網中心在2018年投資的,所以這個是國家的計畫,這個我們非常謝謝國網中心跟那時候的科技部,那因為政府計畫的特性是它會跟著預算有就做,沒有就要去做別的嘛。
黃:所以它可能這個政府換人了,主管換人了,它也可能政策又不延續。
吳:這是另外一回事,但好的科技計畫,大家再喜歡它都有預算結束的時候,那預算結束,設備可能還留在那裡沒有什麼關係,但我為了做這個計畫的人,可能就要去做別的事情。
黃:就要解散。
吳:但各位可能都知道所有的好的技術都需要累積,對不對?所以在我們早期參與臺灣杉二號兼職的時候,那時候科技部就跟我們聊說,它很希望我們不是只是去做一個標案。
吳:而是這個標案成功以後,民間廠商可以看到這個潛力,願意也拿自己的錢出來成立一個民間經營的公司,然後再跟政府合作,去把在標案時代政府累積的這些好的人才跟技術,順利地把它spinoff。
吳:那這個過程其實是非常類似1986年87年臺積電從工研院spinoff的故事啦,我們就是在那個年代,經濟部有很大型的VOSI計畫,那VOSI計畫三十幾億,它就培養了百名工程師,跟建了一個廠。
吳:就是現在的臺積電一廠它在工研院,所以如果那個時候如果沒有成立臺積電把它spinoff,這計畫就停在那裡了。
黃:等於政府在做一些育成。
吳:對,所以台智雲我們很有幸能夠參與這個過程,所以台智雲就類比在40年前,臺積電它是一個政府計畫的衍生,所以半用的資本是民間資本。
吳:我們現在好的地方是,那時候臺積電成立的時候李國鼎先生還要找很多人去拜託投資,那我們現在這個臺灣經濟好很多嘛。
吳:所以像華碩就領頭先支持,然後再加上剛剛講的幾個金控,所以台智雲就是一個比較大型的新創,就是這個資本要比較多,它要去接國家那時候培養的這些人才,spinoff到台智雲,讓這個所有的技術可以繼續做累積。
黃:是,那您看臺灣這一波生成式AI大爆發之後,AI改變人類生活這是必然的趨勢,那你看接下來可能往哪些方面發展?
吳:這一波生成式AI我就不講產業面,我講社會面,社會面正面來看它就是生產力的革命,就很多人都在論述它最起碼可以增加整體人類社會20%或30%的生產力,非常可觀,都是錢嘛。
吳:這是正面來看,但它也會帶來一些威脅,譬如說你的這個數位科技可以讓人變得這麼厲害。
吳:沒有能力應用科技的人,他就會更為弱勢,所以本來就知道資訊平權問題會變得更重要,那生成式AI會讓生成內容變得更容易,所以原來就很重要的事實、查證這些,在生成式AI就變成是。
黃:更挑戰。
吳:更挑戰,所以就是或者在一個是,你這些AI都在利用這些數據,那這些數據它是否可以符合法規?符合著作權?倫理的應用?那這也是一個社會,就社會的配套,所以就不同國家,現在都在做這些AI的基本法。
黃:倫理規範。
吳:其實都是在面對,它既然不可逆,我們要擁抱它,你一定要有一些社會上面的準備,我覺得這是臺灣很適合,比其他國家再走一步。
吳:因為臺灣不大,但我們創新力很夠,然後我們碰到的問題其實也是人家老年化、少子化都一樣,所以我們其實更可以勇於去利用它,但去把社會配套做好。
黃:有些人會擔心喔,AI會到最後反過來會消滅人類,您怎麼看這個問題?
吳:我覺如果你從社會來看,AI本身並沒有代表某種權利義務,它還是要人用嘛。
吳:所以譬如說像,如果我們要做一個全民醫生,以現在的法規你沒有辦法做,不是技術行不行,而是這個對談有可能有失誤的那個責任liability。
吳:那這個其實你用社會制度就可以去做配套,所以我,我沒有那麼擔心,最終這種層次的問題,但我覺得像資訊平權是真問題,對,就是你知道的人就會很厲害,不知道的人他就更找不到工作。
黃:是是,所以這個其實也是下一波教育必須要推動努力的方向。
吳:沒錯沒錯。
黃:怎麼樣讓有了一些AI的基礎設施,能夠讓偏鄉、城市啊都能夠有,然後在教育上讓每個人都具備有應用AI能力。
黃:那但是在這個產業的發展上,臺灣就像您漢章專精的這個醫學AI的領域,其實這應該是臺灣很強的強項對不對?
黃:因為臺灣的醫學很厲害,科技能力也很強,所以是不是在這方面,我們也有一些接下來的計畫?
吳:當然啊,就是我們從開放角度我們就會覺得,各個行業的各個應用對我們來講都是機會,而且臺灣有算力嘛,臺灣有半導體。
吳:所以我們一定在範算力領域一定會執牛耳,我覺得這件事情大家也不要妄自菲薄,我們不一定是大國,但我們一定是強國,所以在算力這一塊,但在哪些應用領域,我們可能還可以。
黃:對世界做更多貢獻。
吳:對世界有幫助,那當然就有一些領域是大家比較重複再談的,醫療一定是一個,因為很簡單,我們的醫療是有國家品牌,就臺灣的醫療做的東西,其他國家會覺得值得參考嘛。
吳:這些都是條件嘛,對對對,所以就是當然是這樣,然後,那這一波生成式AI又要用,就比過去更多的這些數據,那臺灣在30年前因為健保刺激臺灣真的在醫療數據是累積比較長久、比較多,所以這大概都是我們。
黃:也比較完整。
吳:比較完整的條件,當然也有臺灣做數位醫療自己的挑戰,那譬如剛剛講的臺灣的醫生很忙,臺灣的醫生很忙又很累,就會影響他去使用一些新東西的動力,這難免。
黃:對,所以我們變成要用AI來減輕他的工作量。
吳:所以那就要有把它有一個正面循環嘛,讓大家越來越把時間分配在累積加值的地方。
黃:更有價值的地方。
吳:對對。
吳:剛剛聊了很多產業技術,我想這個是本來就是產業界的事啦,但社會議題我還是在今天這個難得的場合,就是像教育、醫療它都不是純產業議題,它都是社會議題。
吳:所以很希望主持人、教育電臺我們能夠有更多好的這種對談,可以刺激大家有更多去找到好的方法。
黃:謝謝漢章。
吳:謝謝。
黃:其實我們節目也是在做媒體素養,科技資訊媒體素養的推廣,就希望一般的民眾更瞭解AI,不要害怕它,我們好好的善用它,對不對?
黃:這個趨勢已經不可擋了,你抵抗它也沒有用。
吳:沒有用。
黃:不如是好好瞭解它,然後善用它。
吳:是。
黃:謝謝,謝謝漢章今天的分享。
吳:謝謝,謝謝,謝謝大家,謝謝兆徽。(校對:陳俞臻|更新:2023/08/16)