深圳市奧斯恩凈化技術(shù)有限公司

主營(yíng)產(chǎn)品: 環(huán)境噪聲揚(yáng)塵監(jiān)測(cè)系統(tǒng),手持式粉塵檢測(cè)報(bào)警儀,在建工地?fù)P塵在線監(jiān)控系統(tǒng),建設(shè)工地?fù)P塵噪聲污染在線監(jiān)測(cè)系統(tǒng)

9

聯(lián)系電話

18948352970

您現(xiàn)在的位置: 首頁(yè)> 技術(shù)文章 > 聲源識(shí)別技術(shù)盒子 各種條件下都可識(shí)別出聲紋類型

空氣質(zhì)量微型監(jiān)測(cè)站

網(wǎng)格化空氣監(jiān)測(cè)站

VOCS在線監(jiān)測(cè)系統(tǒng)

VOC在線監(jiān)測(cè)系統(tǒng)

無(wú)組織排放在線監(jiān)測(cè)系統(tǒng)

工地?fù)P塵噪聲在線監(jiān)測(cè)系統(tǒng)

工地?fù)P塵噪聲聯(lián)動(dòng)控制在線監(jiān)測(cè)系統(tǒng)

工地塔吊霧炮噴淋降塵在線監(jiān)測(cè)系統(tǒng)

揚(yáng)塵噪聲視頻在線監(jiān)測(cè)系統(tǒng)

混凝土攪拌站揚(yáng)塵監(jiān)控系統(tǒng)

惡臭實(shí)時(shí)監(jiān)測(cè)系統(tǒng)

粉塵濃度報(bào)警儀

氮氧化物監(jiān)測(cè)系統(tǒng)

車載環(huán)境監(jiān)測(cè)系統(tǒng)

車載式揚(yáng)塵噪聲視頻監(jiān)測(cè)系統(tǒng)

走航環(huán)境監(jiān)測(cè)車

景區(qū)公園負(fù)氧離子監(jiān)測(cè)站

路況能見度監(jiān)測(cè)系統(tǒng)

云平臺(tái)

油煙在線監(jiān)測(cè)

物聯(lián)網(wǎng)自動(dòng)氣象站

防爆報(bào)警粉塵檢測(cè)儀

室內(nèi)環(huán)境質(zhì)量監(jiān)測(cè)儀

揚(yáng)塵傳感器

室內(nèi)外噪聲環(huán)境監(jiān)測(cè)系統(tǒng)

手持式粉塵濃度檢測(cè)儀

固定式粉塵濃度檢測(cè)報(bào)警儀

無(wú)人機(jī)環(huán)境監(jiān)測(cè)系統(tǒng)

森林防火監(jiān)測(cè)系統(tǒng)

氣體檢測(cè)儀

碳排放氣體監(jiān)測(cè)

水質(zhì)監(jiān)測(cè)系統(tǒng)

煙氣在線監(jiān)測(cè)系統(tǒng)

機(jī)動(dòng)車尾氣監(jiān)測(cè)

手持式揚(yáng)塵噪聲檢測(cè)儀

便攜式環(huán)境在線監(jiān)測(cè)儀

噪聲在線監(jiān)測(cè)系統(tǒng)

環(huán)保大數(shù)據(jù)監(jiān)測(cè)平臺(tái)

水質(zhì)綜合檢測(cè)儀

塵埃粒子計(jì)數(shù)器

遠(yuǎn)程喊話在線監(jiān)控系統(tǒng)

解決方案

監(jiān)測(cè)平臺(tái)

環(huán)境監(jiān)測(cè)系統(tǒng)

氣體報(bào)警器

揚(yáng)塵在線監(jiān)測(cè)設(shè)備

負(fù)氧離子監(jiān)測(cè)系統(tǒng)

氨逃逸在線監(jiān)測(cè)系統(tǒng)

智慧工地視頻監(jiān)控

工況電力監(jiān)測(cè)系統(tǒng)

氣象監(jiān)測(cè)站

輻射監(jiān)測(cè)系統(tǒng)

光伏組件灰塵監(jiān)測(cè)

大壩安全預(yù)警系統(tǒng)

氣溶膠檢測(cè)儀

冷鏈溫濕度監(jiān)測(cè)

消防水池液位水位監(jiān)測(cè)

公司信息

聯(lián)人:
梁經(jīng)理
話:
機(jī):
18948352970
真:
86-0755-85296639-604
址:
深圳市寶安區(qū)鳳塘大道141號(hào)大洋田工業(yè)區(qū)2棟4樓
編:
518100
個(gè)化:
www.china-osen.cn
網(wǎng)址:
www.china-aosien.com
鋪:
http://true-witness.com/st334553/
給他留言

聲源識(shí)別技術(shù)盒子 各種條件下都可識(shí)別出聲紋類型

2024-11-5  閱讀(57)

聲源識(shí)別技術(shù)盒子產(chǎn)品背景

聲紋識(shí)別,也被稱為說(shuō)話人識(shí)別,是一種生物識(shí)別技術(shù),通過(guò)轉(zhuǎn)換聲音信號(hào)為電信號(hào),用計(jì)算機(jī)進(jìn)行特征提取和身份驗(yàn)證。其生物學(xué)基礎(chǔ)在于生物的語(yǔ)音信號(hào)攜帶著聲波頻譜,就像指紋一樣具有穩(wěn)定性。

人類語(yǔ)言的產(chǎn)生是人體語(yǔ)言中樞與發(fā)音器官之間一個(gè)復(fù)雜的生理物理過(guò)程,人在講話時(shí)使用的發(fā)聲器官--舌、牙齒、喉頭、肺、鼻腔在尺寸和形態(tài)方面每個(gè)人的差異很大,所以任何兩個(gè)人的聲紋圖譜都有差異。

換做其他生物或者物體也是。同一類的聲音的語(yǔ)音信號(hào)也攜帶著聲波頻譜。提取出來(lái)并做分類和識(shí)別。這個(gè)就是聲紋識(shí)別技術(shù)。

聲紋識(shí)別的主要任務(wù)包括:語(yǔ)音信號(hào)處理、聲紋特征提取、聲紋建模、聲紋比對(duì)、判別決策等。

image.png

聲源識(shí)別技術(shù)盒子技術(shù)特點(diǎn)

1.噪聲聲音類型識(shí)別是指通過(guò)機(jī)器學(xué)習(xí)算法,對(duì)環(huán)境中的噪聲進(jìn)行分類,以判斷其可能的來(lái)源和類型。例如,區(qū)分機(jī)器噪聲、人聲噪聲、交通噪聲等。

2. AI在噪聲聲音類型識(shí)別中的應(yīng)用主要體現(xiàn)在深度學(xué)習(xí)技術(shù)中,特別是卷積神經(jīng)網(wǎng)絡(luò)的應(yīng)用。首先,需要收集大量的聲音數(shù)據(jù),并利用深度學(xué)習(xí)算法對(duì)這些數(shù)據(jù)進(jìn)行訓(xùn)練,以提取出有用的特征并進(jìn)行模型優(yōu)化。然后,將輸入的聲音與已知的聲音模型進(jìn)行比對(duì),通過(guò)計(jì)算輸入聲音的特征與模型之間的距離或相似度,來(lái)確定輸入聲音的身份。

3.此外,對(duì)于特定的應(yīng)用場(chǎng)景,如室內(nèi)場(chǎng)景、戶外場(chǎng)景識(shí)別,公共場(chǎng)所、辦公室場(chǎng)景識(shí)別等,還可以使用專門的音頻處理前端部分。

4.值得注意的是,盡管AI在噪聲聲音類型識(shí)別方面有著廣泛的應(yīng)用前景,但是在實(shí)際應(yīng)用中仍然面臨著許多挑戰(zhàn),如噪聲環(huán)境的復(fù)雜性、語(yǔ)音信號(hào)的多樣性以及模型的優(yōu)化等問(wèn)題。因此,如何提高噪聲聲音類型識(shí)別的準(zhǔn)確性和魯棒性,仍然是未來(lái)研究的重要方向。


聲源識(shí)別模型盒子技術(shù)路線

1.建立音頻樣例庫(kù),覆蓋面廣,根據(jù)不同的噪聲監(jiān)管單位將聲音劃分為五大類,不少于50個(gè)聲音子類別;

2.通過(guò)深度學(xué)習(xí)AI技術(shù),對(duì)噪聲樣本進(jìn)行分析和處理,提取出其中的聲紋特征,構(gòu)建聲紋識(shí)別模型;

3.不斷的測(cè)試和優(yōu)化,提高聲紋識(shí)別模型的準(zhǔn)確性和魯棒性,使其能夠在各種環(huán)境和條件下都能準(zhǔn)確地識(shí)別出聲紋類型;

4. 采用深度卷積神經(jīng)網(wǎng)絡(luò)算法實(shí)現(xiàn)音頻事件的識(shí)別分類。通過(guò)卷積操作對(duì)音頻進(jìn)行時(shí)域特征和logmel頻域特征的提取,并結(jié)合波形的時(shí)域特征和頻域特征作為音頻的有效特征,再通過(guò)卷積采樣進(jìn)一步獲取特征圖,最終以全連接網(wǎng)絡(luò)分類器實(shí)現(xiàn)特征的類別分類。

聲紋11.jpg

技術(shù)特點(diǎn)

主控芯片:Rockchip RK358

CPU:8 核 64 位處理器

4 個(gè) Cortex-A76 和 4 個(gè) Cortex-A55 及獨(dú)立的 NEON 協(xié)處理器

Cortex-A76 主頻 2.4GHz,Cortex-A55 主頻 1.8GHz

GPU:集成 ARM Mali-G610;內(nèi)置 3D GPU;兼容 OpenGL ES1.1/2.0/3.2、

OpenCL 2.2 和 Vulkan 1.2

NPU:內(nèi)嵌的 NPU 支持 INT4/INT8/INT16/FP16 混合運(yùn)算,算力高達(dá)6Top

存儲(chǔ):8G+64G emmc

接口:有 2 個(gè) HDMl 輸出端口,1 個(gè)輸入 HDMl 端口,最高可解碼 8K@60P視頻,兩個(gè) PCIe 擴(kuò)展的 2.5G 以太網(wǎng)接口,配備一個(gè)支持安裝 NVMe 固態(tài)硬盤的 M.2 M-Key 插槽,一個(gè)支持 Wi-Fi6/BT 模塊的 M.2 E-Key 插槽。此外,有 2 個(gè) USB 3.0、2 個(gè) USB 2.0、2 個(gè) Type-C(其中一個(gè)為電源接口)

基于 Pytorch 實(shí)現(xiàn)的聲紋識(shí)別模型:模型是一種基于深度學(xué)習(xí)的說(shuō)話人識(shí)別系統(tǒng),其結(jié)構(gòu)中融入了通道注意力機(jī)制、信息傳播和聚合操作。這個(gè)模型的關(guān)鍵組成部分包括多層幀級(jí)別的 TDNN 層、一個(gè)統(tǒng)計(jì)池化層以及兩層句子級(jí)別的全連接層,此外還配備了一層 softmax,損失函數(shù)為交叉熵。

特征提?。侯A(yù)加重->分加窗->離散傅里葉變換->梅爾濾波器組->逆離散傅里葉變換

模型訓(xùn)練集:>100000 個(gè)訓(xùn)練樣本

聲音類型:聲音類型主要?jiǎng)澐譃槲宕箢悇e,分別為生活噪聲、施工噪聲、工業(yè)噪聲、交通噪聲、自然噪聲,其中包含打雷,犬吠,刮風(fēng),敲擊、蟲鳴鳥叫、蛙鳴等不少于 50 個(gè)聲音子類別

聲紋識(shí)別準(zhǔn)確率:≥90%

識(shí)別響應(yīng)速率:<1s

調(diào)用方式:支持云端調(diào)用或者本地終端調(diào)用

技術(shù)協(xié)議:支持 HTTP 協(xié)議

接口種類:USB、HDMI、SD、RJ45

電源接口:TYPE-C

工作電壓:5V3A

聲紋2.png





產(chǎn)品對(duì)比 產(chǎn)品對(duì)比 二維碼 在線交流

掃一掃訪問(wèn)手機(jī)商鋪

對(duì)比框

在線留言