本篇文章給大家談?wù)劷o孩子起名字大全2019,以及給孩子起名字大全2020鼠年的知識點,希望對各位有所幫助,不要忘了收藏本站喔。
中國有 6000 萬人名字里有生僻字,數(shù)字化時代的便利,卻是他們的噩夢。
貝貝調(diào)侃自己是一個「生僻字患者」。她的名字左邊一個王,右邊一個瑩,意為「光潔像玉的石頭」。在數(shù)字世界,這卻是一個無法被計算機(jī)語言識別的生僻字,常常被顯示為一個問號或者白色方塊「?」,有時只能改用拼音「yíng」。
麻煩從未停止過。在買一根大蔥都能掃碼支付的時代,名字有生僻字的她,無法完成實名認(rèn)證,是一個被線上支付隔絕在外的人。微信搶紅包的熱鬧,支付寶、微信支付的便捷,在 2022 年 1 月 28 日之前,她都未曾體驗過。
這樣的權(quán)利是通過反復(fù)多次,長時間地溝通才重新找回的。貝貝一邊找支付寶、微信客服反饋,一邊找人民銀行監(jiān)管投訴尋找解決方案。最后通過綁定 3 個賬戶姓名一致銀行卡的辦法,才終于「變成了正常人」。
她把經(jīng)歷發(fā)在社交平臺,2 年里,陸陸續(xù)續(xù)有相似經(jīng)歷的人和她互動。有相同困擾的人不在少數(shù),據(jù)統(tǒng)計,名字中有生僻字的人大概有 6000 萬。背后的原因是:在電子設(shè)備上可以無障礙使用的常用漢字大概在 3 萬左右,也意味著,有超過 70% 的漢字被排除在數(shù)字世界之外。
這些生僻字往往暗藏著最初起名時,對人希望的寄托。被最多人提到的「由頁」是美好,「華韋」是光亮,?意為「飛龍在天」。但在數(shù)字化越是深入的地方,這些寓意美好的生僻字帶來的困擾就會越多。
從出生前在醫(yī)院建檔案,到上戶口,辦理身份證,銀行卡,醫(yī)院掛號,再到保研時信息錄入學(xué)信網(wǎng)、玩游戲時的實名認(rèn)證、乘飛機(jī)在線選座……有一個有生僻名的名字,生活中的困難幾乎會伴隨一生。一些人被迫改名、換姓。
在數(shù)字化時代,生僻字困擾的不止是人,還有地。有生僻字的地名,因為無法正常輸入、顯示而徹底消失在電子地圖上。山東省濰坊市奎文區(qū),在元明更替之際就已經(jīng)存在的「貝亅 (zhī)」?fàn)柷f,就因為生僻字問題,兩度更名,一開始叫則爾莊,后又在 2019 年更名為芝爾莊。存在 600 余年的「貝亅」就這樣消失了。
中國從 1974 年,開始源源不斷地幫助漢字「上網(wǎng)」,最先在計算機(jī)語言中通行的,是只有 26 個字母的英文,但漢字是表意文字,只有將字、形狀、編碼,三者一一對應(yīng),一個漢字才可能出現(xiàn)在數(shù)字世界。當(dāng)編碼或者字形不被系統(tǒng)所支持時,就成了數(shù)字世界的「門外漢」,被歸類為生僻字。
除了讓漢字有統(tǒng)一的編碼之外,它仰賴輸入法、手機(jī)廠商、APP 制造商的一套完整且成規(guī)?;捏w系。生僻字帶來的問題,很難依靠市場的商業(yè)選擇而解決,「很少人會為了輸入或者顯示輸入法而買單」。
50 年時間過去,變化正在發(fā)生。越來越多漢字擁有了數(shù)字世界的「身份證」,2022 年 7 月 19 日,國家市場監(jiān)管總局批準(zhǔn)發(fā)布《信息技術(shù)中文編碼字符集》(GB 18030-2022 國標(biāo)),收錄的漢字已經(jīng)達(dá)到 88115 萬個。這其中,最重要的更新就是收錄了公安人口信息專用字庫新增的 614 個漢字。
今年 8 月開始,這將會作為強(qiáng)制性國家標(biāo)準(zhǔn),政府服務(wù)和公共服務(wù)的信息產(chǎn)品都必須執(zhí)行這一標(biāo)準(zhǔn)。而在這之前,這是一個很難衡量得失的產(chǎn)品改進(jìn),在做任何選擇都要更考慮投入產(chǎn)出比的今天,一群人正在努力拉回這些被落下的名字。
01 一個名字帶來的難題
云南麗江永勝縣的一個傈僳族村子里,一群姓「鴨」的人最懂得生僻字為生活帶來的苦楚。
在更換第二代身份證時,原本姓「nia」,字為「上鳥下甲」姓的村民們,集體將姓氏換成了鴨。
傈僳族有氏族文化,「nia」在他們的語言中,是鳥的意思。但曾經(jīng)靠手寫傳承的氏族之名,在電腦系統(tǒng)中無法輸入,讓他們遭遇了辦證件、出行、求學(xué)的困難。全村 700 多人,集體改名,姓「鴨」。
從那之后,這個有氏族文化的民族,姓氏就從天上飛的鳥,變成了地上跑的鴨。人們甚至找不到這個姓氏更改的由來,誰做的決定,誰定下了「鴨」這個字。在數(shù)字化升級的過程中,他們的名字被落下了。
一位村民提到了他們對此仍有避諱,不愿意讓孩子繼續(xù)姓「鴨」。
在越是信息化、數(shù)字化的時代,生僻字帶來的難處就更加明顯。
一位從英國回國的女生,因為名字中有生僻字無法輸入,申請不到健康碼,反復(fù)給大使館打電話希望能特殊處理。回國后,無法實名做核酸檢測也成了問題,最后跑了上海的四五家醫(yī)院,才通過手填的方式才做上了當(dāng)時隨便在小區(qū)樓下就能做上的核酸檢測。這次的困擾之后,她果斷改掉了名字。
一部分人選擇死磕。貝貝不愿意改名,但名字無法輸入的問題必須要解決。
知道癥狀出現(xiàn)在哪里,貝貝就成了這個名字的專業(yè)「醫(yī)生」。她幾乎可以反射性地告訴同樣因為這個名字而困擾的人,在各個場合輸入「ying」字的訣竅:身份證 U+E362、安卓 U+2C386、搜狗輸入法 U+E052。
這是她長期通過各種渠道反饋,才終于贏回來的名字。甚至在哪些銀行,這個名字能通過什么方法辦下銀行卡,她也門兒清。名字同樣有「王瑩」的一位女生,至今都只能綁定父母的信息,才能正常使用微信。
侯先生名字有「?」字,他能使用的銀行卡只有兩張,一張靠拆字,一張靠拼音,「只能祈禱別出什么幺蛾子。」
也有人未能掌握要領(lǐng),打不出自己的名字。只能在互聯(lián)網(wǎng)上求救。用最原始的辦法,讓別人先用可以輸入的鍵盤打回來,再進(jìn)行復(fù)制。而在多數(shù)需要人臉識別的場合,他們多數(shù)情況會被攔住,向各種工作人員一遍遍解釋。
蔣燡出生于 70 年代,在越來越多手機(jī) APP 都需要實名認(rèn)證的今天,生僻字帶來的麻煩越來越大。
她曾遇到過在醫(yī)院看病,門診收費處可以打出名字,但醫(yī)生的問診系統(tǒng)卻沒有的情況。交得了錢卻看不了病,得不到檢查報告。這背后的問題是,即便是在同一個體系,使用的程序有差別,生僻字也照樣會帶來問題。
「數(shù)字化都已經(jīng)很發(fā)達(dá)了,打出這個字不應(yīng)該是一個很復(fù)雜的問題,畢竟科技在發(fā)展,生僻字不應(yīng)該成為一個難題?!故Y燡說。
02 生僻字到底難在哪里?
讓生僻字能被輸入和顯示,無障礙地穿梭于數(shù)字世界,需要依賴多方的意識與決心,也是一場不能以商業(yè)收益衡量的共謀。
一個生僻字變成「正常字」,從被找到,到考證、賦碼、擴(kuò)容國標(biāo)、字形設(shè)計、再到最終的推廣應(yīng)用,中間是漫長的過程。只有從工信部電子工業(yè)標(biāo)準(zhǔn)化研究院、字庫廠商、輸入法、手機(jī)廠商,APP 制作方等軟硬件廠商,中間各方徹底地打通,才有正常輸入、顯示生僻字的可能。
有時,生僻字只是被阻攔在賦碼環(huán)節(jié),都會折損大量的時間。
工信部電子工業(yè)標(biāo)準(zhǔn)化研究院中文信息研究室主任黃姍姍長期在跟漢字打交道,她說,一個字的編碼依賴于國際標(biāo)準(zhǔn)化組織 ISO/IEC 10646 的工作,他們會對全世界各國提交的所有漢字進(jìn)行統(tǒng)一編碼,涉及不同國家之間的漢字細(xì)微差異和連接認(rèn)同與查證,因此,生僻字賦碼的過程非常復(fù)雜且漫長。
每年中國提交的漢字都在 1000 字左右,而負(fù)責(zé)給漢字編碼的國際標(biāo)準(zhǔn)化組織,每年工作組只開兩次會,「這次無法解決的問題就留到下次」。這就導(dǎo)致,一個漢字從提交到最終獲得國際標(biāo)準(zhǔn)化組織認(rèn)定的編碼,基本都需要 4 至 5 年的時間。
生僻字編碼的過程是漫長的,但用字的需求隨著數(shù)字化的到來卻更加緊迫。
搜狗輸入法生僻字項目負(fù)責(zé)人辜海玻記得,他們撥通蔣燡電話時,她在電話的那頭哽咽了,她覺得自己的需求受到了重視,問題有了被解決的可能性。
去年 11 月,搜狗輸入法中新增了「生僻字征集」功能,希望征集在 8 萬字新字庫基礎(chǔ)上,仍然無法打出來的生僻字。蔣燡迫切地希望新的公共字庫中,能增加自己的名字,分別在第 1457、5528、7327 次重復(fù)提交了這個字。她遇到的問題中,最顯著的就是跨系統(tǒng)使用的障礙。盡管在公安、社保系統(tǒng)中,蔣燡的名字已經(jīng)能顯示,但在其他場合,例如銀行、醫(yī)院,這仍然是一個生僻字,無法通用。有一家銀行曾經(jīng)多次給她打電話說,銀行已經(jīng)能打出她的名字,但她不敢用,也不敢改,因為她擔(dān)心這會打破現(xiàn)在的平衡,反而讓要給她匯款轉(zhuǎn)賬的人無法繼續(xù)正常使用。
受限于這樣的機(jī)制,標(biāo)準(zhǔn)化研究院也在考慮,通過自主性更強(qiáng)的國家標(biāo)準(zhǔn),先收錄漢字解決未來的問題。
本質(zhì)上,兩者技術(shù)上工作并無大的差別。但新提交的生僻字有了一個更快速的響應(yīng)流程,涉及到急用的人名、地名等,通過數(shù)據(jù)考察和有實際應(yīng)用需求的漢字就會更早通過國家標(biāo)準(zhǔn)先流通起來。時間也能縮短到 2-3 年,甚至更短。
根本上,生僻字的問題要徹底解決,跨系統(tǒng)的顯示才是棘手的問題。一部分機(jī)構(gòu)為了解決用戶的困擾,會通過不同的編碼來登記名字,但這帶來的問題是,一旦涉及到聯(lián)網(wǎng)環(huán)節(jié),又會造成一個接一個的差池。
從今年 8 月開始,隨著將會強(qiáng)制執(zhí)行新標(biāo)準(zhǔn),過去各方落下的功課,也需要快速補(bǔ)足。建立統(tǒng)一的標(biāo)準(zhǔn)只是解決生僻字問題的第一環(huán)。
據(jù)不完全統(tǒng)計,漢字的總數(shù)約為 10 萬個,其中仍有許多生僻字尚未被編碼,但具有實用價值。數(shù)字世界的漢字從 3 萬到 8 萬,花了 50 年,而之所以從規(guī)則人要求把生僻字重新?lián)炱饋?,大擴(kuò)容,本身也在為了避免過去被忽視的生僻字會從「罕用」變成「不用」。
03 商業(yè)公司并不商業(yè)的選擇
「適配需要成本,大家都不動,這件事就沒有實現(xiàn)的可能」,搜狗輸入法 2022 年去尋找廠商合作時,吃到了不少的閉門羹,「這不是我們 KPI 里最重要的事」。
盡管生僻字影響著 6000 萬人的生活,但解決生僻字問題,卻幾乎帶不來任何的商業(yè)利益。在互聯(lián)網(wǎng)公司都在「降本增效」時,生僻字的改造很難被劃在優(yōu)先級更高的位置。
而此時,生僻字在搜狗輸入法內(nèi)部,已經(jīng)與無障礙化的改造劃上了等號。搜狗輸入法 CEO 魯劍告訴極客公園,從 2023 年開始,公司的 OKR 里面除了用戶增長和商業(yè)價值之外,多了一項「社會價值」。
事實上,搜狗輸入法至今一直處在虧損狀態(tài)?!冈隍v訊內(nèi)部做一個虧損產(chǎn)品,確實是有壓力的」,魯劍說。但好在,過去搜狗輸入法做的通過眼睛控制輸入的眼動儀,2022 年搜狗輸入法重投入的「眾聲無障礙計劃」,在社會價值層面都有其回報,也契合近幾年騰訊力求的,投入更多錢做更多有社會價值的貢獻(xiàn)。
這些支撐搜狗輸入法去做市場上第一家快速響應(yīng)投入到解決生僻字問題的商業(yè)公司。而隨著新中文編碼字符集將在今年 8 月 1 日開始強(qiáng)制執(zhí)行,生僻字的解決開始變成一件「不得不」解決的問題。
從解決編碼到讓各個場景都支持,這是一條走了很久的路。
一群以商業(yè)銀行、相關(guān)政府機(jī)構(gòu)、微信支付寶相關(guān)人士,受生僻字所困擾的普通網(wǎng)友共同創(chuàng)建了的「生僻字交流群」。群從 1 個擴(kuò)散到兩個,如今已經(jīng)超過 700 人,他們在群里提供盡可能的幫助,從各個平臺如何解決生僻字認(rèn)證,到具體的生僻字編碼,在處理各類公共事務(wù)時可以采取的方法,在這里,可以圍觀到「一個普通人因為生僻字導(dǎo)致的充滿麻煩的一生」。
事實上,系統(tǒng)對字符的支持分為數(shù)據(jù)庫和客戶端,能輸入?yún)s未必能顯示。騰訊搜狗輸入法早在 2021 年 11 月就上線了「生僻字鍵盤」,這個特殊的輸入法擁有筆畫、拼音、「拼音+筆畫」三種輸入方式,幫助生僻字都能被打出來。但在不同的手機(jī)系統(tǒng)、電腦系統(tǒng),甚至不同的 APP 中,顯示仍然是一種麻煩。
讓生僻字顯示,手機(jī)廠商起至關(guān)重要的作用。魯劍舉了一個例子,集成生僻字雖然不會影響手機(jī)的運行,但假設(shè)字庫分別搭載在各個手機(jī)軟件中,一個 10M,100 個手機(jī) APP 就會用掉 1 個 G,字庫占據(jù)的內(nèi)存就會指數(shù)級增加;但假設(shè)是廠商接入,那各個產(chǎn)品就可以直接調(diào)用廠商字庫,「廠商一旦適配,下面的各個應(yīng)用的適配就水到渠成,產(chǎn)生多米諾骨牌的效應(yīng)。」
但問題仍未被完全解決。在未能有統(tǒng)一的國家標(biāo)準(zhǔn)時,「一字多碼」的狀況層出不窮。在不同系統(tǒng)之間,統(tǒng)一生僻字的代碼一旦不相同,仍然會出現(xiàn)無法顯示的問題。「王瑩」在搜狗輸入法使用的 PUA 碼與戶籍系統(tǒng)仍不相同,PUA 碼(Private Use Areas)是解決未被 Unicode 標(biāo)準(zhǔn)收錄文字,在某些特定場景使用文字的一種方法,搜狗輸入法、乃至戶籍管理系統(tǒng)中,都存在這樣的 PUA 碼。這樣的狀況同樣需要時間去一一解決。
另外,8 萬字的新標(biāo)準(zhǔn)還未能囊括全部的漢字。2023 年 4 月 20 日,騰訊聯(lián)合工信部電子工業(yè)標(biāo)準(zhǔn)化研究院等發(fā)起的生僻字征集小程序,第一天就收到用戶提交生僻字 1404 個。提交次數(shù)最多的是陜西知名的 biangbiang 面,有些人用手寫,有些靠拍照,更多人參與進(jìn)來試圖讓更多漢字留在中文數(shù)字世界。
這些都是問題正在被解決的信號——很多人也都不再需要主動或者被動地?fù)Q掉名字。曾頔初中升高中時,正值全國統(tǒng)一更換戶口本。工作人員找不到「頔」,就打成了「碩」,直到中考前夕這個錯誤才被發(fā)現(xiàn),「差點耽誤了高中升學(xué)」。折騰許久,換回來后,她的戶口本上就多了一個她從未用過的曾用名:曾碩。
工作時她也有一個「替代名」,單位打卡機(jī)上也找不到頔,她只好選取別的漢字代替,胡亂選了「曾翟」,這個名字陪她打了四年卡。8 月新標(biāo)準(zhǔn)強(qiáng)制實施后,意味著生僻字問題有了第一條休止線,在數(shù)字化的世界中,像曾頔一樣的人找到自己的名字未來就不再是問題,也不應(yīng)該是問題。
本文源自極客公園