4月8號是值得紀念的一天,工作上把公司的軟體玩到新的高度。具體來說,實打實整合了agentic workflow (代理人工作流程)到本司的控制軟體。控制什麼?本司的SEM機台,掃描電子顯微鏡。
七年前(自2019)開始開發CLI(命令行介面),第一版開發出來,我心想靠這個帶來的紅利我就可以待個10年了!沒想到一路孤獨,不受青睞。2026年初迎來Agent+LLM(大型語言模型),CLI是自然的接口,我七年的累積無縫接軌!我心想,這又是一個大躍進,它潛力能帶來的紅利,又可以讓我待另一個10年!
當天是下午七點,我看著Agent神奇般地自動控制機台時,興奮難以言喻,在公司尋了一圈看哪些同事還在,當場展示給他們看,又做了一個影片傳給幾位好同事。隔天反應不一,有些平平,我想,噢你看不出來它的潛力嗎?最好的反應來自AI Program的同事,一下子就懂我在做什麼了,還願意幫我宣傳,不過禍福相依,另一組人馬馬上跳出來說這正是他們要做的東西,很有正名之感,這下我緊張了,明明是我的CLI,怎麼被你包裝成你的Agentic solution了?連名字SEM Claw你都取好了?最突兀的還有幾點,第一、幸好我同事幫我打抱不平,直接會議上問說你是不是串接晁偉的CLI,對方承認說是。第二、對方有問題就來問,沒事就消失,在我看來是搞神秘不想跟你分享,但我心裡評估,七年來我跌過的大小坑你又如何會知道?想跳開我複製我的成果並不簡單,不過心裡還是不爽。第三、本司陋習,喜歡做簡報,成果卻拿不出來。這是為什麼我強調實打實,當我說出口時,我已經做到了。反觀對方會議上講的天花亂墜,連名字都先取好了…。"Action is louder than words"
四月29,本司例行AEM (All Employee Meeting),高層被問到怎麼我們都沒有AI solution?我心竊喜,原來我有三個月的Edge,在下次AEM前,我要好好幫自己打響知名度,我的成果榮辱歸我,這件事突顯了我的政治影響力不足,七年都要不到資源,是我的問題還是我上司的問題?為什麼對方成軍三個星期就有三名生力軍了?
回到技術上,我好奇與研究的重點在於解決"解釋的模糊"這個題目。只要是程式語言,能寫出來執行邏輯就確定了,百分百deterministic,這是好的不得了的性質,因為相對LLM的不確定性(e.g.同樣的問題有不同的答案),我要的正是增加LLM輸出確定性的手段,而CLI正是這樣的手段之一,CLI讓LLM這大腦可以開始感知外界,這外界就是SEM機台,它的控制、它的影像。於是,我目前的心得是,我必須把自然語言等效看成程式語言才行,前者有解釋空間,而後者沒有。讓兩者等效正是努力的方向,LLM輸出自然語言讓人讀是不夠的。LLM輸出程式腳本才是真正了解LLM是不是真理解你問題的最終仲裁。
這有點像智能合約,或傳統的notarization(公証),我是甲方、LLM是乙方、我需要第三方Agent公証,Agent之所以能公証,是因為它能獨立運行,透過執行去擔保解釋的唯一性。
沒有留言:
張貼留言