開源尖峰人物專訪 | 對未來充滿信心 —— 開源、創業和社區的 KOL:潘娟
一年一度的 OSCAR 開源產業大會 2023 即將召開,我們打算尋找過去 5 年的尖峰人物,和他們進行一番對話,回顧過去的得失,展望未來~
OSCAR 開源尖峰人物之潘娟介紹
SphereEx 聯合創始人 & CTO, Apache Member & Incubator Mentor, Apache ShardingSphere PMC, AWS Data Hero, 中國木蘭開源社區導師,騰訊云 TVP。曾負責京東數科數據庫智能平臺的設計與研發,現專注于分布式數據庫 & 中間件生態及開源領域。被評為《2020 中國開源先鋒人物》,2021 OSCAR 尖峰開源人物。CSDN 2021 年度 IT 領軍人物,2022 年在 ICDE 發表論文“Apache ShardingSphere,A Holistic and Pluggable Platform for Data Sharding”。2022 年入選 Globee Awards“Chief Technology Officier of the Year”榮譽。2022 年作為第一作者出版海外書籍《A Definitive Guide to Apache ShardingSphere》。
2023 訪談篇
8.23 號的下午,在 SphereEx 公司辦公室,「開源之道」?適兕代表 OSCAR 大會組委會 (下稱 OSCAR) 采訪了潘娟,以下是根據現場錄音整理:
OSCAR:首先談一下 OSCAR 尖峰人物設置的意義或感想
潘娟:尖峰開源人物的設置,對于開源社區和開發者來說,具有非常重要的意義和價值。這個表彰了在開源領域取得杰出成就的個人,同時也是向全球宣傳開源文化和價值的窗口。另外一方面,獎項的設立也能夠鼓勵更多的開發者參與開源貢獻,讓開源、技術創新擴展到更大范圍,從文化、風潮方面,來推動開源、技術的發展。激發創新和協作精神,推動全球開源技術和文化的發展。此外,我看過獲得過 OSCAR 尖峰人物的歷年名單,所選出來的尖峰人物,還是很有“質量”的,是相對客觀、公正的,是較有含金量的,起頭起的好,后續就會獲得大家的關注,這些尖峰人物,確實是大家都認可的人,如此一來,后續每年都會有更多的人積極的申報和參選。只要保證尖峰人物的質量是高的,規則制定好,評判的公正性到位,一定會鼓勵更多的開源貢獻者。
OSCAR:開源尖峰人物的機制是推薦,現在距離大會還有一個月,你會推薦一些開源貢獻者嗎?
潘娟: 我覺得我會推薦,我心目中是有一些老師是認可的,愿意去推薦,有兩個原因:一、我認可開源貢獻者的努力,我希望他們能夠得到一定的回報,只有這樣才能形成正循環,否則,把開發者雪藏了,就形成了惡性循環,我們要極力避免。二,我之所以推薦他們,嗯..... 我還是希望他們能夠得到一個正向的反饋。
OSCAR:在過去的幾年當中,尤其是最近,我們經歷了變化,包括新冠疫情的過去、技術的變革,想請你聊一下你的看法和觀點。
潘娟:談兩方面,首先,當我們談開源的時候,不止是開源文化、開源風潮,也包括參與者,技術、公司、組織,當風潮過去之后,這些都會多少受到影響,比如說我們討論的話題,慢慢的從開源轉換到了 AI、ChatGPT,受這些影響呢,那些在高潮時發展起來的,無論是個人,還是組織、社區、公司,都受到了影響。但從另外一個角度講,這也是回歸到了正常,因為沒有任何一個事情,永遠是居高不下,事情本身就是一個漲潮漲落的,我們必須去接受歷史的這樣一個規律,沒有對和錯,它就是歷史的發展規律,要去接受這個規律,我們只能基于這樣一個現實進行調整。
OSCAR:作為你個人來講,是 SphereEx 的 CTO、Apache ShardingSphere PMC, AWS Data Hero,OSCAR 開源尖峰人物,身兼多職,也就是圈內的領導者,站在前面振臂高呼人,以這樣一個角色,如何看待當下的局面?
潘娟:從管理者的角度來看,我能做的就是基于這個事實,盡可能掌控我周圍的事情,推動他們向好的方向演進,例如我所在的社區、Apache 會旗下的一些項目以及我的公司。我會采取一些措施,例如調整研發周期,采用小步迭代的方式,讓社區和產品可持續發展,同時也會向其他項目提供指導,確保這些項目能夠繼續發展。在這個時候,我們需要沉下心來,埋頭去做研發,踏實做好產品。做好充足的準備迎接下一場挑戰,這是我能夠控制的事情。
從個人角度來講,那作為一 KOL,我能做的就是表達出我自己的切身體會,至少讓聽到的人能夠將我的觀點作為參考。這樣我就覺得非常不錯了。
OSCAR:說到手上可以掌控的,那和我們聊聊 Apache 的項目,SphereEx 的產品吧~目前都是什么狀態?
潘娟:先從開源說起吧,目前我正在 mentor 的項目是百度捐贈給 Apache 軟件會的圖數據庫項目:HugeGraph , 采用小步迭代的方式來進行,由于投入是有限的,只能做一些小的可短期實現的功能,release 周期也短一些。
Apache ShardingSphere 這個項目也一樣,由于是社區,目前是盡可能的去吸引更多的新人加入,讓社區不斷有活力進來。一些社區成員已經習慣了這個社區,受到目前的熱度降低的影響,或者是其它原因,減少了一些投入,這個時候如果有一些新鮮的血液,覺得開源不錯,能夠加入進來,我覺得這是另外一種方式激活這個社區的發展。
從公司的角度來講,現在這個階段肯定是以客戶為中心的,所以呢,我們現在的產品 release 的 feature 可能不再是規劃三年的事情,甚至是一年,這樣會花很多時間做基礎的建設,我們現在做的是三個月,是因為客戶需要某種類型的特性,我們就要把時間和精力投入到這部分,實現快速的把產品推向市場,推向客戶,然后就是為了拿訂單,快速獲得市場的驗證,這是我現在能夠采取的一些措施,我們的商業版已經發布了 1.6 版本,馬上發 1.7 版本,就是當前客戶需要什么,市場需要什么,我們就快速的滿足。
OSCAR:可以舉個例子嗎?
潘娟:我們有一個客戶,他們對于 Oracle 數據庫上的加解密具有迫切的需求,處于安全的考量,必須對數據進行處理,在過去,我們就會想把 Oracle、MySQL、PG 等所有的主流數據庫都進行考量,更多考慮對底層的支持,希望一勞永逸,一次性把所有數據庫的加解密都支持了。現在呢,我們換了策略,我們發現更多的用戶是希望支持 Oracle,比例占 50%,那么我們就會優先把這個場景先跑通,然后推向市場,如果接下來還有其它數據庫需要支持,那么我們就再去做,比如 PG,是這樣的一個迭代過程。
當下很多企業也在降本增效,他們也希望節省成本,比如把冷數據從生產環境遷移到便宜的存儲上,盡可能的把線上數據放在冷備上,但是冷備還有查詢的需求,這個時候就會想有沒有一個軟件能夠按照一定規則自動做這些事情,這個時候 SphereEx 就會為用戶提供這樣的功能,即時的將線上數據安全可靠的遷移到冷備,實現降本的目的。在特殊的需求下,我們產品的設計也跟著變。
OSCAR:為用戶提供解決方案,是否在 SphereEx 研發原來的規劃里?
潘娟:在的,我們要做的是 Data as Service,整個圍繞數據庫,尤其是異構的情形下的管理、治理和數據訪問的平臺。理論上,我們原來的核心如解決分布式的問題,不同數據庫之間的聯邦查詢的問題,這是我們原來的主線,副線任務,才是剛才說的冷熱數據分離,但是現在呢,隨著時間的推移,我們發現副線的需求漸漸增多,那么我們就需要將精力做一些分配,把副線變為新的主要任務,這是我們做的一個調整,但這些仍然在我們的“大盤子”里的一塊。
OSCAR:那也就是說轉換思路,集中力量做一些更為迫切需要的事情。哦,對了,可以和大家聊聊 Apache ShardingSphere 最近的開發情況嗎?
潘娟: ShardingSphere 是一個社區驅動的項目,不能以商業訴求去理解,當然,SphereEx 的員工是該社區很重要的力量來源之一,SphereEx 會把商業特性的更為基礎和通用的代碼提交給上游。另外,ShardingSphere 項目目前正在進行的特性是提高項目 SQL 支持度,它不是一個特定的功能,如 CDC,它是基建的功能,更為通用,更為底層。這樣的話,可以讓更多人加入參與進來,比如有些公司在用 Oracle,有些公司使用 MySQL,如 A 用戶只關心 Oracle,那么可能就會去支持 Oracle SQL,另外的公司,就去提供其它方言的支持。
OSCAR:你剛才提到,自己所參與的開源社區,如 ShardingSphere 社區需要引入更多的新鮮血液,這塊有沒有具體的方法或策略可以和大家分享一下嗎?
潘娟:第一,開源項目得有的做,比如 ShardingSphere 要支持更多的 SQL,我們現在開始對接 MongoDB,有新的東西大家可做,這是根本的第一步,要是說一個項目已經完事了,也就意味著沒得做了。第二,比如今天的采訪,上周參加的 ApacheCon Asia,做一個大會的分享,自然而然就會帶一些流量;第三,ShardingSphere 本身已經開源 5、6 年了,相對來說,流程之類的已經蠻成熟了,該提需求提需求;第四:我們在海外也會參加很多活動,比如 Open Source India,印度本地的開源會議,只要在這樣的會議上出現,就肯定會人參與,有很多種方法讓人們去嘗試,感興趣的話就會進一步發展,就會有新的人加入。
以上提到的這幾種方法,不一定都百分百有效,但是只要去做,就一定會有人過來。
OSCAR:SphereEx 目前的版本,從解決方案的角度講,或者是從行業來講,有什么樣的優勢?
潘娟:優勢點一:免改造。比如 Oracle、MySQL、PG 等數據庫等加解密,因為我們做的是一個中間層,對用戶的業務影響很低,尤其是一個企業混合使用多種數據庫,如果在不同的數據庫中作加解密,是一件非常麻煩的事,我們提供中間層,一步就可以把不同類型的數據庫都給支持了,然后業務還不需要改造,僅僅做的就是引入 SphereEx,原來指向數據庫的配置,現在指向 SphereEx,這是吸引很多客戶的優勢之一。
優勢點二:類似于輕量級數據庫解決方案,舉例而言,我們最近簽了一個央企的客戶,他們沒有選擇一個全新的數據庫,而是基于現有的 MySQL 群,選用了 SphereEx,這樣的話,更安全和穩定,原有的數據庫不動,而只是把 SphereEX 引進去,這個風險是可控的,如果說完全徹底的換一套新的數據庫,就意味著要把原來的基建替換掉,這個動作會很大,這個時候誰來承擔風險,尤其是核心數據,還有就是分布式數據庫周圍的生態建設,比如原來是 MySQL 集群、PG 集群,引進 SphereEx,原有的架構沒有變,運維人員、生態、工具都沒有變,如果切換為全新的,那么就全權依賴于這家新的數據庫廠商了,就有被鎖定的風險了。
優勢點三:成本優勢,現在一提數據庫,那就是開銷巨大的數字,沒有個幾百萬根本下不來,SphereEx 的目標是解決問題,而且還是低于全新數據庫幾倍的成本來解決實際的問題,市場上對價格敏感,又能解決問題:如查詢慢,就可以多考慮 SphereEx。
OSCAR:從 CTO 的角度來看,當下的隱私計算、大模型等,該如何看待數據?
潘娟:我們回顧 20 年前,那個時候可以稱的上數據荒漠了,相比于現在,有很多類型的數據庫出現,相應的數據庫工具的出現,以及 SphereEx 這樣的數據即服務的出現,就是因為互聯網、移動互聯網爆炸式發展,產生了很多所謂的數據資產,現在所有的東西都是數字化的,人類已經產生了無限多的數據了,現在考慮的是如何利用這些數據,怎么去挖掘價值,我們看到各式各樣的數據庫,大數據處理的工具等,以及開源的項目大爆發:Hadoop、Spark、Hive 等,大家都在試圖挖掘寶藏,開發各類應用。
ChatGPT 的出現則又是另外一種玩法了,我們提供了一定的基建,有數據資產,有非常多的軟件工具能夠幫助我們挖掘和使用,讓數據流動起來,現在可以有大模型的訓練,用上這些基建的軟件,去把底層的數據價值真正高效的挖掘出來,符合場景的挖掘出來,這是很厲害的一件事,比如過去的方法:半天寫點腳本,花很長的時間去試探性的挖掘,還不知道有沒有用,現在不一樣了,ChatGPT 等直接革了命了,原來覺得大數據訓練離我們很遠,現在隨便登一個網站,智能客服后面就是大模型,很快就集成到應用中了,而且部署的速度是極快的,就是在我們過去所作的基建之上的新的一輪“卷”的方式,這是一件很有意思的事情。慢慢的我們會發現,我們可以用數據,保存數據,不斷的去挖掘數據,最終還是用在場景上,最大化挖掘出它的價值,這個是很難產生商業價值的事情,我覺得,后面 AI 的公司,可能起一波再倒一波,最終會沉淀下來一些。
OSCAR:SphereEx 會擁抱這樣一個過程嗎?
潘娟:我覺得現在不會,我知道它是未來的一個趨勢,但是我首先要考慮成本,我不可能把現有的丟掉,趕緊擁抱新的,我得保證我現在這個體量的人能夠活下去,這是第一我要考慮成本問題,第二我要考慮場景和客戶買不買單,這個東西最終做完,不是滿足自己怎么樣,而是真正符合業務的需求。
怎么能夠讓公司的產品和 AI 結合,滿足客戶的需求,才能讓客戶買單,這是需要進一步探索的。而且還需要相應的人才的,這些都是需要考量的,不能說因為它熱,所以我們就的去擁抱它,顯然是行不通的,最終是要落地的。如果說我是一個個體的話,不影響公司,愿意做什么就去做什么,但是帶領整個公司去跑,這個時候考慮的是如何將 AI 結合到公司的產品,無論是產研投入,還是人才投入,要去打磨產品交付的,需要考量的東西還是蠻多的。
OSCAR:對于編碼助手,如 GitHub Copilot 等,我們的開發人員開始用了沒有?
潘娟:我們的開發者還沒有用,我自己測試過,之所以沒有用,并不是說這些編碼助手不好,而是說我們特殊的場景,我們要寫的業務邏輯,Copilot 是無法幫助我們做到這點到,它只能做一些更為基礎的函數的實現,我們的研發團隊最終是要為特性負責的,功能更為復雜,不是一個從 0 到 1 的過程,是一個從 80 分到 100 分的過程,是一個依賴開發者的過程。
OSCAR:可以為參與開源的新人提一些建議或經驗參考嘛?比如是為還在上大學的學生們而言,開源意味著什么。
潘娟:鑒于招聘市場上的現狀,倒是一個告訴學生嘗試開源的一個契機,學生在這個階段,一定是找到自己想做的事情,或者是技術的一個方向,又或者是快速的成為佼佼者,或者是快速的完成從學生到職場人士的轉變,這些事情都是可以“前置”的,那怎么樣才能“前置”了呢?那么就可以在本科后兩年,或研究生期間,開源是其中一個方式,也可以選擇其他的方式,開源就像是一個興趣小組,在開源技術社團中是可以鍛煉開源技術的,就像是在足球社團中聯系足球技術一樣。
舉例而言,我們這里有一位同學,來自斯里蘭卡,正在上大三,從 Google Summer of Code 進入 Apache ShardingSphere,我是他的導師,一個暑假,這位同學就掌握了這樣的一套技能,處理 SQL 之類的,非常開心,還寫了一定博客,所謂的前置就是:在沒有學習校內的數據庫相關課程,也沒有報課外的培訓班,就獲得了這樣的技能,而且所寫的代碼,公司還應用于實際環境。
再舉另外一個例子,有一位同學,處于年輕人常見的不知道自己要什么的狀態,剛畢業,想找一份工作,然后就在開源中做了一陣子,認識了很多平日里接觸不到的人,然后就找到了方向,要不要走出去看看,這就是開源給他帶來了一些契機,如果是坐著不動,那么就什么也不會有,很可能還在迷茫中。開源打開了某種機會的窗口,這也是其有意思的地方。
回到問題上,就是鼓勵大家以參與社團的方式,去參與開源,參與進來,機會才有。
OSCAR:接下來就是你自由發揮的時間了。相對 OSCAR 的受眾、開源圈的,Apache community 等等你希望他們聽到的。
潘娟:我希望,今天是我分享,也有其他的開源尖峰人物分享,無論是誰分享,最好的方式就是行動起來,哪怕只是一個點,一定要去做,如果只是聽,過一會就忘了。你只要啟動起來,就一定會有變化,有了變化,就會知道,至少有大概率知道自己想要什么。
我一直信奉的是,從小的地方做,然后就是去探索,最后要堅持下去,因為只有量變才能引起質變,這三步至關重要,對我自己來說,第一步:如果想要改變,就從小開始,第二步:在這個過程不斷去探索,第三步就是去堅持做,去修煉。
OSCAR:那么你選擇創業這兩年多,最大的感受是什么?
潘娟:創業有點像操作一艘船,原來上船的時候,不知道會遭遇什么,在航行的過程中,就會遇到觸礁、暴風雨,那么我能做的就是,控制這條船盡量平穩的在正確的航線上朝著正確的方向前進,這是我非常大的一個感受。為了能夠做到這一點,我的知識體系和認知、行為模式全部都在迭代,在改變。
舉個例子,原來的時候,我做開源或 Community,你開心,我開心,大家一起開心,創業之后,做公司不是這樣子的,在公司一定有人不開心,為了集體行動,總是要犧牲一部分人的直覺和認知的,作為決策者,必須做出權衡,必須拍板,必須推進進度,并且承擔所有后果。
OSCAR:當下我們正處于一個節骨眼上,環境在發生了變化,普遍信心不足,你覺得你現在的狀態會被影響到嘛?
潘娟:事物發展都是螺旋上升、有漲有落。在低潮的時候,我們要做的是審視分析自己后、調整目標、并有信心地堅持做下去!拿 SphereEx 舉例。首先,我們已經建立起了比較完善的開源社區生態,產品和服務也得到了用戶的認可。因此,目前的市場波動不會對我們的核心業務產生重大影響。那其次,我們公司目前的財務和資本管理策略,能夠應對市場變化和不確定性。另外我們的投資者和董事會也理解基礎軟件開源商業公司的特殊性,并對我們的長期戰略和未來發展有著充分的信心。
最后也是非常重要的一點,要去思考,這件事是不是你發自內心想做的?我相信開源技術和商業模式的力量,認可我自己決定要走的路,這就足夠了,剩下的交給時間。因為我知道,無論重復多少次選擇,我還是會堅定走自己想要的方向,沒有人能預知未來和對錯。
廣告聲明:文內含有的對外跳轉鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節省甄選時間,結果僅供參考,早報網所有文章均包含本聲明。
隨便看看:
網友評論:
推薦使用友言、多說、暢言(需備案后使用)等社會化評論插件