飛象原創(chuàng)(孫迎新/文)
“突然感覺,我又有信心了,未來又有希望了!”
當兒童圖書編輯,同時也是一名語障人士的崔珈瑜看到通過AI技術現(xiàn)場對聲音進行修復的展示后,她興奮與渴望的心情溢于言表,“我希望能夠盡快地擁有它。”
語障人士 崔珈瑜(圖中左二)
沒人知道這一天的到來,讓那些在寂靜世界里蟄伏的人們期待了多久。當手機里傳來清晰流暢的語音時,我們知道,聽力障礙人士的世界已經(jīng)悄然改變。他們的心聲,那些曾經(jīng)被沉默掩蓋的渴望,如今正通過HarmonyOS NEXT的AI聲音修復功能,清晰地傳達給每一個人。這不僅是技術的突破,更是開啟了一段全新的人生體驗,讓愛與溫暖在無聲的世界中流動。
這一刻,科技對障礙群體的深切關懷和承諾終于成為現(xiàn)實。對于聽障人士來說,最觸動心弦的,莫過于2022年冬殘奧火炬手,同時也是一位患有先天性極重度耳聾的殘障人士朱軼琳那句再普通不過的話:“希望社會大眾能聽見,聽懂我們的聲音!边@不僅是對清晰交流的渴望,更是對平等參與社會生活的向往。
聽障人士朱軼琳(圖中左二)
根據(jù)世界衛(wèi)生組織的數(shù)據(jù),全球有超過10億人的生活因殘障而不便,每7個人之中,就有1個人需要無障礙設備的幫助。在我國,有超1700萬視障者、超2700萬聽障者、7000萬讀寫障礙者,還有超過2億的65周歲以上老年人。許多人因聽力障礙而影響了語言學習能力,導致不同程度的言語障礙。這些數(shù)據(jù)背后,是一個個渴望溝通與理解的靈魂,他們面臨著社交、信息獲取、職場溝通等多重困境。
為了幫助障礙群體實現(xiàn)平等融入社會生活的愿望,發(fā)展AI技術成為大勢所趨。華為終端發(fā)布的《華為終端可持續(xù)發(fā)展報告》(2023-2024)中顯示,用技術創(chuàng)新推動可持續(xù)發(fā)展,讓每個人都平等地融入數(shù)字世界。華為持續(xù)聚焦信息無障礙、教育與健康、綠色環(huán)保及社會責任四大可持續(xù)發(fā)展戰(zhàn)略,并在終端可持續(xù)發(fā)展委員會的引領下,推動各項目標的落地。
重生之聲:引領聽障人士開啟嶄新的語言之旅
黑暗與寂靜或許是這個世界上最難忍受的苦難。女詩人艾米莉·狄金森在孤獨中埋頭寫詩三十年,飽受疾病與身體障礙的困擾,她的詩中充滿了無助與失望,同時也成為障礙人士心態(tài)的真實寫照。
我本可以忍受黑暗
如果我不曾見過太陽
可是那陽光,刺破了
我內心的荒涼
現(xiàn)實生活中,聽障人士在溝通交流中面臨著巨大的挑戰(zhàn)。他們不僅在社交場合中難以融入,更在工作、教育等重要領域遭遇重重障礙。例如,聽障人士在就醫(yī)時無法流暢回答醫(yī)生的詢問,導致溝通效率低下,甚至耽誤病情的診療;在購物或點餐時,他們無法與店員順暢溝通,只能依賴文字或手勢,增加了交流的復雜性和時間成本;工作場景中,聽障人士因無法用正常的言語與工作伙伴有效溝通,面臨職業(yè)發(fā)展的障礙,面試過程中因無法用言語清晰表達自己的能力和意愿而錯失就業(yè)機會。
聽障人士的語言表達也會遇到巨大的困難。由于聽力障礙影響他們學習和使用語言的能力,他們的發(fā)音往往不準確,帶有病理性腔調,普通人非常難于識別理解。這些人士在日常生活和工作中會遇到各種困難,包括社交、信息獲取、面試、職場溝通等,其中約8成聽障人士依靠口語溝通,他們的言語障礙表現(xiàn)為發(fā)音不準確,韻律、音調異常,這使得他們在交流中常常遭遇誤解和歧視。
隨著智能時代的到來,AI技術的介入,為聽力殘疾障礙人士的語音修復帶來了革命性的改變。通過HarmonyOS NEXT全新的AI聲音修復功能,可以對用戶的語音進行實時分析、修復和優(yōu)化,提升用戶發(fā)音的可懂度和音色的相似性。這項技術主要針對四級和三級言語障礙人群設計,通過構建言語障礙人員專用的語音識別大模型,和業(yè)界領先的語音合成大模型能力,搭建端到端聲音修復系統(tǒng)。無需文本輸入,實現(xiàn)了直接修復前語音輸入、修復后語音輸出,并且盡可能地保留了用戶音色。
通過AI進行語音修復這項技術的問世來之不易,華為的研發(fā)團隊在項目初期面臨了巨大的挑戰(zhàn)。由于缺乏前車之鑒和最基本的數(shù)據(jù),方案無從下手。但團隊憑借對無障礙用戶的責任感,決定奮力一搏,沖擊這一個業(yè)界首創(chuàng)項目。他們收集網(wǎng)上公開的言語障礙音視頻,召集各地的言語障礙用戶進行數(shù)據(jù)錄制活動。針對病理性發(fā)音特征,華為在模型結構和方案上進行不斷調整,同時使用萬小時量級的高表現(xiàn)力說話人數(shù)據(jù),最大程度地保留大模型的原始能力。
鴻蒙之聲:AI助力障礙人士跨越信息桎梏
在數(shù)字化時代,信息的自由流通是社會進步的基石。然而,對于障礙人士來說,這個世界的聲音似乎總是遙不可及。但隨著系列鴻蒙原生智能技術的誕生,這一群體的信息障礙正逐步被突破。
華為長期關注無障礙建設,致力于通過系統(tǒng)性的無障礙建設工作幫助障礙群體。當前,使用華為無障礙設備的用戶規(guī)模接近800萬。同時,華為還聯(lián)合全國200多家聾盲協(xié)會,深入全國88個城市開展了220多項華為無障礙功能體驗活動,在線下為障礙人士提供了14000小時的無障礙用機指導與體驗服務。
華為的無障礙建設始于產(chǎn)品設計之初,要求研發(fā)人員將無障礙理念落實在設計和開發(fā)應用的過程中。自2017年起,華為為有溝通障礙的用戶提供了AI字幕、小藝通話、智能問答等功能,讓手機成為用戶最貼心的助手,而他們的手機也從可用變成好用,再從好用到愛用。
在無障礙建設過程中,鴻蒙原生智能技術也在不斷得到創(chuàng)新與完善。鴻蒙原生智能技術的核心在于AI聲音修復功能,這是一項針對聽力殘疾障礙人士設計的創(chuàng)新技術。
從華為無障礙“黑科技”,我們也能看到科技以人為本的具體樣子。AI聲音修復功能利用人工智能技術對用戶的語音進行實時分析、修復和優(yōu)化,提升了用戶發(fā)音的可懂度和音色的相似性;同時,在保持與個人音色相似的前提下,聲音修復功能可以大大提升內容的可懂度和清晰度,使得言語障礙人士可以更自信地進行交流。
通過這些功能,鴻蒙原生智能技術為聽障人士提供了一個全新的交流平臺,讓他們能夠更加自信地與世界對話。隨著技術的不斷進步和完善,我們有理由相信,未來將有更多的障礙人士能夠享受到科技帶來的便利,真正實現(xiàn)信息的自由流通。
未來之聲:HarmonyOS NEXT開創(chuàng)聲音修復新紀元
信息的無障礙流通是構建智能世界的關鍵,HarmonyOS NEXT以其業(yè)界首創(chuàng)的聲音修復功能,為聽障人士打開了一扇通往清晰交流的大門。
在鴻蒙NEXT發(fā)布會上,華為終端業(yè)務首席執(zhí)行官何剛強調了華為對于無障礙科技的長期承諾,并介紹了HarmonyOS NEXT在聲音修復方面的突破。何剛表示,華為一直在努力通過AI技術解決聽障人士的溝通問題,從AI字幕到小藝通話,再到現(xiàn)在的AI聲音修復功能,華為不斷推動技術的發(fā)展,以實現(xiàn)更自然、更清晰的交流體驗。
華為終端業(yè)務首席執(zhí)行官 何剛
HarmonyOS NEXT的聲音修復功能是華為在信息無障礙領域的又一重大創(chuàng)新。這一功能主要針對四級和三級言語障礙人群設計,利用AI技術對用戶的語音進行實時分析、修復和優(yōu)化。通過構建言語障礙人員專用的語音識別大模型,HarmonyOS NEXT能夠實時分析用戶的語音,并對其進行修復和優(yōu)化,提升發(fā)音的可懂度和音色的相似性。
無需文本輸入是HarmonyOS NEXT聲音修復功能的一大特點,與傳統(tǒng)的語音轉文字再合成的方法不同,HarmonyOS NEXT無需文本輸入最大限度地方便了用戶,實現(xiàn)了直接從語音輸入到語音輸出的端到端處理。
如果你對聲音的品質有所要求,那保留用戶音色則讓新生的語音具有更多的親和力。在提升語音可懂度的同時,HarmonyOS NEXT盡可能地保留了用戶的原始音色,使得交流更加自然,減少了用戶的陌生感。
語音的最大功能是傳遞信息,因此對語音含義的理解至關重要。HarmonyOS NEXT聲音修復功能顯著提升可懂度。據(jù)華為實驗室數(shù)據(jù)顯示,聲音修復后可懂度最大提升80%以上,這對于言語障礙用戶來說是一個巨大的進步。
在多場景適用性方面,無論是在生活還是工作中,HarmonyOS NEXT的聲音修復功能都能幫助言語障礙人士更自信地進行面對面交流。
HarmonyOS NEXT的聲音修復功能一經(jīng)推出,便受到了業(yè)界的廣泛關注和積極評價。科技評論家和行業(yè)分析師都對華為在無障礙科技領域的這一創(chuàng)新表示贊賞。他們認為,這不僅是技術上的突破,更是對聽力殘疾障礙人士社會參與權的一次重要提升。
同時,業(yè)界普遍認為,HarmonyOS NEXT的聲音修復功能不僅為聽力殘疾障礙人士提供了更好的交流工具,也為整個社會創(chuàng)造了更多的包容性和可能性。這一功能的推出,也標志著華為在無障礙科技領域的領導地位,為其他科技公司樹立了榜樣。
共融之聲:鴻蒙無障礙體驗與生態(tài)建設的和諧交響
數(shù)字世界不該有人被遺忘,鴻蒙正在打造一個全新的充滿溫度的智能世界。
無障礙建設是華為的長期責任,但無障礙功能的好壞與體驗卻是由障礙用戶說了算。華為秉持S.H.A.R.E理念,數(shù)字包容作為華為可持續(xù)發(fā)展的重大戰(zhàn)略之一,號召更多人參與,積極履行自身職責,創(chuàng)建可持續(xù)、有溫度的數(shù)字未來。
華為無障礙始于產(chǎn)品設計之初,開發(fā)規(guī)范明確要求研發(fā)人員將無障礙理念落實在設計和開發(fā)應用的過程中。華為也始終在更新,并且從未在更新版本中忘記障礙用戶。
憑借在生態(tài)建設領域的有力進展,鴻蒙無障礙體驗得到了障礙用戶的高度認可。通過開展跨設備無障礙體驗,華為將無障礙能力向手表、智能眼鏡、筆記本、音箱等設備擴展,滿足障礙用戶多場景需求,實現(xiàn)了跨設備的無縫協(xié)作。
通過匯聚更多合作伙伴的廣泛參與,華為與開發(fā)者、生態(tài)伙伴共同優(yōu)化復雜動態(tài)頁面,確保障礙用戶的使用體驗。例如,南方航空在鴻蒙系統(tǒng)上進行無障礙及適老化App頁面設計,交通銀行為長者用戶打造了手機銀行App“關愛版”,這些服務正在原生鴻蒙上進行適配。
在應用市場的無障礙適配方面,已有超1.5萬個應用和元服務上架HarmonyOS NEXT應用市場,多家生態(tài)伙伴已適配無障礙和適老化功能,極大地豐富了鴻蒙生態(tài)的無障礙體驗。
同時,華為還持續(xù)開展社區(qū)活動和教育,通過開展無障礙功能體驗活動,提供無障礙用機指導與體驗服務,發(fā)放《送給爸媽的手機使用指南》等方式,全方位提升適老化能力,構建有溫度的智能世界。
障礙群體的心聲,正在被世界聽見,通過技術的持續(xù)創(chuàng)新,華為在信息無障礙領域持續(xù)深耕,用科技創(chuàng)新推動無障礙技術發(fā)展,致力于構建一個全新的充滿溫度的智能世界,讓每個人都能平等、方便地享受科技發(fā)展帶來的美好生活。華為終端業(yè)務首席執(zhí)行官何剛的這些話如同蕩漾起的陣陣漣漪,傳導到更遠的地方。
科技,不讓任何一個人掉隊。攜手生態(tài)伙伴,共筑更溫暖的數(shù)字未來。