飛象原創(chuàng)(孫迎新/文)
“突然感覺,我又有信心了,未來又有希望了!”
當(dāng)兒童圖書編輯,同時也是一名語障人士的崔珈瑜看到通過AI技術(shù)現(xiàn)場對聲音進(jìn)行修復(fù)的展示后,她興奮與渴望的心情溢于言表,“我希望能夠盡快地?fù)碛兴!?
語障人士 崔珈瑜(圖中左二)
沒人知道這一天的到來,讓那些在寂靜世界里蟄伏的人們期待了多久。當(dāng)手機(jī)里傳來清晰流暢的語音時,我們知道,聽力障礙人士的世界已經(jīng)悄然改變。他們的心聲,那些曾經(jīng)被沉默掩蓋的渴望,如今正通過HarmonyOS NEXT的AI聲音修復(fù)功能,清晰地傳達(dá)給每一個人。這不僅是技術(shù)的突破,更是開啟了一段全新的人生體驗(yàn),讓愛與溫暖在無聲的世界中流動。
這一刻,科技對障礙群體的深切關(guān)懷和承諾終于成為現(xiàn)實(shí)。對于聽障人士來說,最觸動心弦的,莫過于2022年冬殘奧火炬手,同時也是一位患有先天性極重度耳聾的殘障人士朱軼琳那句再普通不過的話:“希望社會大眾能聽見,聽懂我們的聲音。”這不僅是對清晰交流的渴望,更是對平等參與社會生活的向往。
聽障人士朱軼琳(圖中左二)
根據(jù)世界衛(wèi)生組織的數(shù)據(jù),全球有超過10億人的生活因殘障而不便,每7個人之中,就有1個人需要無障礙設(shè)備的幫助。在我國,有超1700萬視障者、超2700萬聽障者、7000萬讀寫障礙者,還有超過2億的65周歲以上老年人。許多人因聽力障礙而影響了語言學(xué)習(xí)能力,導(dǎo)致不同程度的言語障礙。這些數(shù)據(jù)背后,是一個個渴望溝通與理解的靈魂,他們面臨著社交、信息獲取、職場溝通等多重困境。
為了幫助障礙群體實(shí)現(xiàn)平等融入社會生活的愿望,發(fā)展AI技術(shù)成為大勢所趨。華為終端發(fā)布的《華為終端可持續(xù)發(fā)展報(bào)告》(2023-2024)中顯示,用技術(shù)創(chuàng)新推動可持續(xù)發(fā)展,讓每個人都平等地融入數(shù)字世界。華為持續(xù)聚焦信息無障礙、教育與健康、綠色環(huán)保及社會責(zé)任四大可持續(xù)發(fā)展戰(zhàn)略,并在終端可持續(xù)發(fā)展委員會的引領(lǐng)下,推動各項(xiàng)目標(biāo)的落地。
重生之聲:引領(lǐng)聽障人士開啟嶄新的語言之旅
黑暗與寂靜或許是這個世界上最難忍受的苦難。女詩人艾米莉·狄金森在孤獨(dú)中埋頭寫詩三十年,飽受疾病與身體障礙的困擾,她的詩中充滿了無助與失望,同時也成為障礙人士心態(tài)的真實(shí)寫照。
我本可以忍受黑暗
如果我不曾見過太陽
可是那陽光,刺破了
我內(nèi)心的荒涼
現(xiàn)實(shí)生活中,聽障人士在溝通交流中面臨著巨大的挑戰(zhàn)。他們不僅在社交場合中難以融入,更在工作、教育等重要領(lǐng)域遭遇重重障礙。例如,聽障人士在就醫(yī)時無法流暢回答醫(yī)生的詢問,導(dǎo)致溝通效率低下,甚至耽誤病情的診療;在購物或點(diǎn)餐時,他們無法與店員順暢溝通,只能依賴文字或手勢,增加了交流的復(fù)雜性和時間成本;工作場景中,聽障人士因無法用正常的言語與工作伙伴有效溝通,面臨職業(yè)發(fā)展的障礙,面試過程中因無法用言語清晰表達(dá)自己的能力和意愿而錯失就業(yè)機(jī)會。
聽障人士的語言表達(dá)也會遇到巨大的困難。由于聽力障礙影響他們學(xué)習(xí)和使用語言的能力,他們的發(fā)音往往不準(zhǔn)確,帶有病理性腔調(diào),普通人非常難于識別理解。這些人士在日常生活和工作中會遇到各種困難,包括社交、信息獲取、面試、職場溝通等,其中約8成聽障人士依靠口語溝通,他們的言語障礙表現(xiàn)為發(fā)音不準(zhǔn)確,韻律、音調(diào)異常,這使得他們在交流中常常遭遇誤解和歧視。
隨著智能時代的到來,AI技術(shù)的介入,為聽力殘疾障礙人士的語音修復(fù)帶來了革命性的改變。通過HarmonyOS NEXT全新的AI聲音修復(fù)功能,可以對用戶的語音進(jìn)行實(shí)時分析、修復(fù)和優(yōu)化,提升用戶發(fā)音的可懂度和音色的相似性。這項(xiàng)技術(shù)主要針對四級和三級言語障礙人群設(shè)計(jì),通過構(gòu)建言語障礙人員專用的語音識別大模型,和業(yè)界領(lǐng)先的語音合成大模型能力,搭建端到端聲音修復(fù)系統(tǒng)。無需文本輸入,實(shí)現(xiàn)了直接修復(fù)前語音輸入、修復(fù)后語音輸出,并且盡可能地保留了用戶音色。
通過AI進(jìn)行語音修復(fù)這項(xiàng)技術(shù)的問世來之不易,華為的研發(fā)團(tuán)隊(duì)在項(xiàng)目初期面臨了巨大的挑戰(zhàn)。由于缺乏前車之鑒和最基本的數(shù)據(jù),方案無從下手。但團(tuán)隊(duì)?wèi){借對無障礙用戶的責(zé)任感,決定奮力一搏,沖擊這一個業(yè)界首創(chuàng)項(xiàng)目。他們收集網(wǎng)上公開的言語障礙音視頻,召集各地的言語障礙用戶進(jìn)行數(shù)據(jù)錄制活動。針對病理性發(fā)音特征,華為在模型結(jié)構(gòu)和方案上進(jìn)行不斷調(diào)整,同時使用萬小時量級的高表現(xiàn)力說話人數(shù)據(jù),最大程度地保留大模型的原始能力。
鴻蒙之聲:AI助力障礙人士跨越信息桎梏
在數(shù)字化時代,信息的自由流通是社會進(jìn)步的基石。然而,對于障礙人士來說,這個世界的聲音似乎總是遙不可及。但隨著系列鴻蒙原生智能技術(shù)的誕生,這一群體的信息障礙正逐步被突破。
華為長期關(guān)注無障礙建設(shè),致力于通過系統(tǒng)性的無障礙建設(shè)工作幫助障礙群體。當(dāng)前,使用華為無障礙設(shè)備的用戶規(guī)模接近800萬。同時,華為還聯(lián)合全國200多家聾盲協(xié)會,深入全國88個城市開展了220多項(xiàng)華為無障礙功能體驗(yàn)活動,在線下為障礙人士提供了14000小時的無障礙用機(jī)指導(dǎo)與體驗(yàn)服務(wù)。
華為的無障礙建設(shè)始于產(chǎn)品設(shè)計(jì)之初,要求研發(fā)人員將無障礙理念落實(shí)在設(shè)計(jì)和開發(fā)應(yīng)用的過程中。自2017年起,華為為有溝通障礙的用戶提供了AI字幕、小藝通話、智能問答等功能,讓手機(jī)成為用戶最貼心的助手,而他們的手機(jī)也從可用變成好用,再從好用到愛用。
在無障礙建設(shè)過程中,鴻蒙原生智能技術(shù)也在不斷得到創(chuàng)新與完善。鴻蒙原生智能技術(shù)的核心在于AI聲音修復(fù)功能,這是一項(xiàng)針對聽力殘疾障礙人士設(shè)計(jì)的創(chuàng)新技術(shù)。
從華為無障礙“黑科技”,我們也能看到科技以人為本的具體樣子。AI聲音修復(fù)功能利用人工智能技術(shù)對用戶的語音進(jìn)行實(shí)時分析、修復(fù)和優(yōu)化,提升了用戶發(fā)音的可懂度和音色的相似性;同時,在保持與個人音色相似的前提下,聲音修復(fù)功能可以大大提升內(nèi)容的可懂度和清晰度,使得言語障礙人士可以更自信地進(jìn)行交流。
通過這些功能,鴻蒙原生智能技術(shù)為聽障人士提供了一個全新的交流平臺,讓他們能夠更加自信地與世界對話。隨著技術(shù)的不斷進(jìn)步和完善,我們有理由相信,未來將有更多的障礙人士能夠享受到科技帶來的便利,真正實(shí)現(xiàn)信息的自由流通。
未來之聲:HarmonyOS NEXT開創(chuàng)聲音修復(fù)新紀(jì)元
信息的無障礙流通是構(gòu)建智能世界的關(guān)鍵,HarmonyOS NEXT以其業(yè)界首創(chuàng)的聲音修復(fù)功能,為聽障人士打開了一扇通往清晰交流的大門。
在鴻蒙NEXT發(fā)布會上,華為終端業(yè)務(wù)首席執(zhí)行官何剛強(qiáng)調(diào)了華為對于無障礙科技的長期承諾,并介紹了HarmonyOS NEXT在聲音修復(fù)方面的突破。何剛表示,華為一直在努力通過AI技術(shù)解決聽障人士的溝通問題,從AI字幕到小藝通話,再到現(xiàn)在的AI聲音修復(fù)功能,華為不斷推動技術(shù)的發(fā)展,以實(shí)現(xiàn)更自然、更清晰的交流體驗(yàn)。
華為終端業(yè)務(wù)首席執(zhí)行官 何剛
HarmonyOS NEXT的聲音修復(fù)功能是華為在信息無障礙領(lǐng)域的又一重大創(chuàng)新。這一功能主要針對四級和三級言語障礙人群設(shè)計(jì),利用AI技術(shù)對用戶的語音進(jìn)行實(shí)時分析、修復(fù)和優(yōu)化。通過構(gòu)建言語障礙人員專用的語音識別大模型,HarmonyOS NEXT能夠?qū)崟r分析用戶的語音,并對其進(jìn)行修復(fù)和優(yōu)化,提升發(fā)音的可懂度和音色的相似性。
無需文本輸入是HarmonyOS NEXT聲音修復(fù)功能的一大特點(diǎn),與傳統(tǒng)的語音轉(zhuǎn)文字再合成的方法不同,HarmonyOS NEXT無需文本輸入最大限度地方便了用戶,實(shí)現(xiàn)了直接從語音輸入到語音輸出的端到端處理。
如果你對聲音的品質(zhì)有所要求,那保留用戶音色則讓新生的語音具有更多的親和力。在提升語音可懂度的同時,HarmonyOS NEXT盡可能地保留了用戶的原始音色,使得交流更加自然,減少了用戶的陌生感。
語音的最大功能是傳遞信息,因此對語音含義的理解至關(guān)重要。HarmonyOS NEXT聲音修復(fù)功能顯著提升可懂度。據(jù)華為實(shí)驗(yàn)室數(shù)據(jù)顯示,聲音修復(fù)后可懂度最大提升80%以上,這對于言語障礙用戶來說是一個巨大的進(jìn)步。
在多場景適用性方面,無論是在生活還是工作中,HarmonyOS NEXT的聲音修復(fù)功能都能幫助言語障礙人士更自信地進(jìn)行面對面交流。
HarmonyOS NEXT的聲音修復(fù)功能一經(jīng)推出,便受到了業(yè)界的廣泛關(guān)注和積極評價?萍荚u論家和行業(yè)分析師都對華為在無障礙科技領(lǐng)域的這一創(chuàng)新表示贊賞。他們認(rèn)為,這不僅是技術(shù)上的突破,更是對聽力殘疾障礙人士社會參與權(quán)的一次重要提升。
同時,業(yè)界普遍認(rèn)為,HarmonyOS NEXT的聲音修復(fù)功能不僅為聽力殘疾障礙人士提供了更好的交流工具,也為整個社會創(chuàng)造了更多的包容性和可能性。這一功能的推出,也標(biāo)志著華為在無障礙科技領(lǐng)域的領(lǐng)導(dǎo)地位,為其他科技公司樹立了榜樣。
共融之聲:鴻蒙無障礙體驗(yàn)與生態(tài)建設(shè)的和諧交響
數(shù)字世界不該有人被遺忘,鴻蒙正在打造一個全新的充滿溫度的智能世界。
無障礙建設(shè)是華為的長期責(zé)任,但無障礙功能的好壞與體驗(yàn)卻是由障礙用戶說了算。華為秉持S.H.A.R.E理念,數(shù)字包容作為華為可持續(xù)發(fā)展的重大戰(zhàn)略之一,號召更多人參與,積極履行自身職責(zé),創(chuàng)建可持續(xù)、有溫度的數(shù)字未來。
華為無障礙始于產(chǎn)品設(shè)計(jì)之初,開發(fā)規(guī)范明確要求研發(fā)人員將無障礙理念落實(shí)在設(shè)計(jì)和開發(fā)應(yīng)用的過程中。華為也始終在更新,并且從未在更新版本中忘記障礙用戶。
憑借在生態(tài)建設(shè)領(lǐng)域的有力進(jìn)展,鴻蒙無障礙體驗(yàn)得到了障礙用戶的高度認(rèn)可。通過開展跨設(shè)備無障礙體驗(yàn),華為將無障礙能力向手表、智能眼鏡、筆記本、音箱等設(shè)備擴(kuò)展,滿足障礙用戶多場景需求,實(shí)現(xiàn)了跨設(shè)備的無縫協(xié)作。
通過匯聚更多合作伙伴的廣泛參與,華為與開發(fā)者、生態(tài)伙伴共同優(yōu)化復(fù)雜動態(tài)頁面,確保障礙用戶的使用體驗(yàn)。例如,南方航空在鴻蒙系統(tǒng)上進(jìn)行無障礙及適老化App頁面設(shè)計(jì),交通銀行為長者用戶打造了手機(jī)銀行App“關(guān)愛版”,這些服務(wù)正在原生鴻蒙上進(jìn)行適配。
在應(yīng)用市場的無障礙適配方面,已有超1.5萬個應(yīng)用和元服務(wù)上架HarmonyOS NEXT應(yīng)用市場,多家生態(tài)伙伴已適配無障礙和適老化功能,極大地豐富了鴻蒙生態(tài)的無障礙體驗(yàn)。
同時,華為還持續(xù)開展社區(qū)活動和教育,通過開展無障礙功能體驗(yàn)活動,提供無障礙用機(jī)指導(dǎo)與體驗(yàn)服務(wù),發(fā)放《送給爸媽的手機(jī)使用指南》等方式,全方位提升適老化能力,構(gòu)建有溫度的智能世界。
障礙群體的心聲,正在被世界聽見,通過技術(shù)的持續(xù)創(chuàng)新,華為在信息無障礙領(lǐng)域持續(xù)深耕,用科技創(chuàng)新推動無障礙技術(shù)發(fā)展,致力于構(gòu)建一個全新的充滿溫度的智能世界,讓每個人都能平等、方便地享受科技發(fā)展帶來的美好生活。華為終端業(yè)務(wù)首席執(zhí)行官何剛的這些話如同蕩漾起的陣陣漣漪,傳導(dǎo)到更遠(yuǎn)的地方。
科技,不讓任何一個人掉隊(duì)。攜手生態(tài)伙伴,共筑更溫暖的數(shù)字未來。