C# sesli komut ile uygulama açtırma

Kruvazör · 20 Mar 2022

Herkese merhaba arkadaşlar
bugün size
C# ile ses tanıma, sesle komut işleme konusundan bahsedip örnek bir proje paylaşacağım.
çalışma mantığı dilin metne dökülmesinden ibarettir.

Ses tanıma algoritmaları iki farklı metoda dayanıyor. Bunlar;
Automatic Speech Recognition(ASR) ve Speech ToText (STT)
olarak sıralanabilir.

Automatic Speech Recognition(ASR),
otomatik ses tanıma olarak çevrilebilir.
Alınan seslerin donanım tabanlı teknikler ve yazılımla birlikte kullanılarak işlenmesi anlamına geliyor.

Speech ToText (STT)
sesi metne dönüştürme sistemidir.
Seslerin cihaz tarafından metne dönüştürülmesini sağlar.

Algoritmalardan beslenen ses tanıma teknolojileri HiddenMarkov Model(HMM) ve Dynamic Time Warping (DTW) modelleri ile matematiksel olarak çalışır

Nedir bu markov modeli?
Saklı Markov Modeli konuşma gibi istatistiksel özellikleri zamanla değişkenlik gösteren dizilerin modellenmesinde kullanılır.
Saklı Markov modelinde durumlar doğrudan gözlenemez.
Konuşma tanımada yaygın olarak kullanılması 1980’lerden sonra başlamıştır.
Konuşma sinyali istatistiksel özellikleri zamanla değişen bir sinyaldir.
Herhangi bir anlamlı ses dizisi üretmek istediğimizde gırtlak ve dil gibi ses organlarımız hava basıncını ve hava akışını duyulabilecek ses dizileri üretecek şekilde modüle ederler.
Bazı sesler kHz’ler düzeyinde spektral bileşenler içerebilir.
Buna rağmen ses organlarımızın yapısı saniyede en fazla 10 kere değişir.
Ses modelleme, belirli seslerin kısa zaman spektral özelliklerinin analizini içerir ve bu modelleme farklı seslere karşılık gelen ses 8 organ yapısının uzun zaman değişimini tanımlamamızı sağlar.
Zamanla değişkenlik gösteren ve spektral gözlem dizileri ile temsil edilen ses dizilerini tanımlayabilmenin bir yolu bu diziyi bir sesten diğer bir sese geçiş şeklinde Markov zincirleri ile göstermektir. aşağıda görülen birinci derece 3 durumlu Markov zincirinde, sistemin bir t anında N farklı durumdan birinde (S1, S2, S3, S4, SN) olacak şekilde tanımlanabilir.

Nedir bu Dynamic Time Warping?
DTW Belirli bir sözcüğün seslendirilmesi, kişiden kişiye hatta aynı kişinin farklı zamanlarda seslendirmesi ile zaman içinde farklılık gösterebilmektedir.
Aynı sözcüğün seslendirilmesi, bir seslendirmede uzun, bir seslendirmede ise daha kısa zamanda gerçekleştirilebilir.
Aynı zamanda, ses sinyalinde kimi fonemler daha uzun, kimileri ise daha kısa yer almaktadır.
Dynamic Time Warping algoritması yardımıyla, bu iki seslendirme, zaman içinde yayılarak ya da daraltılarak birbirine yaklaştırılmaya çalışır.
Yani bu iki seslendirmenin, zaman olarak örtüştürülmesi işlevi gerçekleştirilir.
DTW, sözcük tabanlı ses tanıma sistemlerinde etkin ve sıkça kullanılan bir yöntemdir.
Bu yaklaşımla, çalışma anında tespit edilen sözcük kesimlemesi,
sistemde kayıtlı sözcük şablonları ile seslendirme zamanları örtüştürülerek karşılaştırılması gerçekleştirilebilir.
aşağıda iki ses sinyali arasında DTW algoritmasının zaman ekseninde uygulanması gösterilmektedir.

o halde artık örnek uygulamamıza geçelim
öncelikle, kendi örneğinizi yapmak isterseniz

using System.Speech.Recognition;

kütüphanesini kurmalı ve

BAŞVURU EKLE

şeklinde başvuru eklemelisiniz

PROGRAM EKRAN GÖRÜNTÜSÜ

Program sizden "RUN" sesli komutunu alınca
seçtiğiniz programı açar.
(mikrofon tavsiye edilir)

KAYNAK KOD/GİTHUB LİNKİ

PROGRAM İNDİRME LİNKİ

speech.rar dosyasını indir - download

speech.rar dosyasını indir, download. Dosya.tc .Dosya Upload. Dosya Paylaş. Dosya Yükle

s6.dosya.tc

virustotal linki

VirusTotal

VirusTotal

www.virustotal.com

(false positive var)

(dil paketi uyumsuzluğu ya da çeşitli problemler çıkarabilir
çözümleri için dm gelebilirsiniz ya da alta yazabilirsiniz.)

Ghost Killer · 20 Mar 2022

eline sağlık.

EbuSalib · 20 Mar 2022

eline sağlık hocam çok güzel olmuş

Kruvazör · 21 Mar 2022

Ghost Killer' Alıntı:
eline sağlık.

EbuSalib' Alıntı:
eline sağlık hocam çok güzel olmuş

Sağolun hocam.

BySciaa · 21 Mar 2022

en kısa sürede deneyeceğim çok teşekkürler

Kızıl_Kelebek · 21 Mar 2022

Faydalı bir paylaşım olmuş elinize sağlık.

Kruvazör · 21 Mar 2022

BySciaa' Alıntı:
en kısa sürede deneyeceğim çok teşekkürler

Sağolun hocam geribildirimlerinizi bekliyorum.

Ling · 21 Mar 2022

Eline sağlık

Helmsys · 21 Mar 2022

Coderx37' Alıntı:
Herkese merhaba arkadaşlar
bugün size
C# ile ses tanıma, sesle komut işleme konusundan bahsedip örnek bir proje paylaşacağım.
çalışma mantığı dilin metne dökülmesinden ibarettir.

Ses tanıma algoritmaları iki farklı metoda dayanıyor. Bunlar;
Automatic Speech Recognition(ASR) ve Speech ToText (STT)
olarak sıralanabilir.

Automatic Speech Recognition(ASR),
otomatik ses tanıma olarak çevrilebilir.
Alınan seslerin donanım tabanlı teknikler ve yazılımla birlikte kullanılarak işlenmesi anlamına geliyor.

Speech ToText (STT)
sesi metne dönüştürme sistemidir.
Seslerin cihaz tarafından metne dönüştürülmesini sağlar.

Algoritmalardan beslenen ses tanıma teknolojileri HiddenMarkov Model(HMM) ve Dynamic Time Warping (DTW) modelleri ile matematiksel olarak çalışır

Nedir bu markov modeli?
Saklı Markov Modeli konuşma gibi istatistiksel özellikleri zamanla değişkenlik gösteren dizilerin modellenmesinde kullanılır.
Saklı Markov modelinde durumlar doğrudan gözlenemez.
Konuşma tanımada yaygın olarak kullanılması 1980’lerden sonra başlamıştır.
Konuşma sinyali istatistiksel özellikleri zamanla değişen bir sinyaldir.
Herhangi bir anlamlı ses dizisi üretmek istediğimizde gırtlak ve dil gibi ses organlarımız hava basıncını ve hava akışını duyulabilecek ses dizileri üretecek şekilde modüle ederler.
Bazı sesler kHz’ler düzeyinde spektral bileşenler içerebilir.
Buna rağmen ses organlarımızın yapısı saniyede en fazla 10 kere değişir.
Ses modelleme, belirli seslerin kısa zaman spektral özelliklerinin analizini içerir ve bu modelleme farklı seslere karşılık gelen ses 8 organ yapısının uzun zaman değişimini tanımlamamızı sağlar.
Zamanla değişkenlik gösteren ve spektral gözlem dizileri ile temsil edilen ses dizilerini tanımlayabilmenin bir yolu bu diziyi bir sesten diğer bir sese geçiş şeklinde Markov zincirleri ile göstermektir. aşağıda görülen birinci derece 3 durumlu Markov zincirinde, sistemin bir t anında N farklı durumdan birinde (S1, S2, S3, S4, SN) olacak şekilde tanımlanabilir.

Nedir bu Dynamic Time Warping?
DTW Belirli bir sözcüğün seslendirilmesi, kişiden kişiye hatta aynı kişinin farklı zamanlarda seslendirmesi ile zaman içinde farklılık gösterebilmektedir.
Aynı sözcüğün seslendirilmesi, bir seslendirmede uzun, bir seslendirmede ise daha kısa zamanda gerçekleştirilebilir.
Aynı zamanda, ses sinyalinde kimi fonemler daha uzun, kimileri ise daha kısa yer almaktadır.
Dynamic Time Warping algoritması yardımıyla, bu iki seslendirme, zaman içinde yayılarak ya da daraltılarak birbirine yaklaştırılmaya çalışır.
Yani bu iki seslendirmenin, zaman olarak örtüştürülmesi işlevi gerçekleştirilir.
DTW, sözcük tabanlı ses tanıma sistemlerinde etkin ve sıkça kullanılan bir yöntemdir.
Bu yaklaşımla, çalışma anında tespit edilen sözcük kesimlemesi,
sistemde kayıtlı sözcük şablonları ile seslendirme zamanları örtüştürülerek karşılaştırılması gerçekleştirilebilir.
aşağıda iki ses sinyali arasında DTW algoritmasının zaman ekseninde uygulanması gösterilmektedir.

o halde artık örnek uygulamamıza geçelim
öncelikle, kendi örneğinizi yapmak isterseniz

using System.Speech.Recognition;

kütüphanesini kurmalı ve

BAŞVURU EKLE

şeklinde başvuru eklemelisiniz

PROGRAM EKRAN GÖRÜNTÜSÜ

Program sizden "RUN" sesli komutunu alınca
seçtiğiniz programı açar.
(mikrofon tavsiye edilir)

KAYNAK KOD/GİTHUB LİNKİ

GitHub - heimdallrRover/speecrecognize

Contribute to heimdallrRover/speecrecognize development by creating an account on GitHub.

github.com

PROGRAM İNDİRME LİNKİ

speech.rar dosyasını indir - download

speech.rar dosyasını indir, download. Dosya.tc .Dosya Upload. Dosya Paylaş. Dosya Yükle

s6.dosya.tc

virustotal linki

VirusTotal

VirusTotal

www.virustotal.com

(false positive var)

(dil paketi uyumsuzluğu ya da çeşitli problemler çıkarabilir
çözümleri için dm gelebilirsiniz ya da alta yazabilirsiniz.)

Eline sağlık çok güzel anlatım olmuş. Ezberden kaçınıp resimlerle de somutluk katılmış.

XX07 · 21 Mar 2022

Eline Emeğine Sağlık

'CaptainKanka · 21 Mar 2022

Eline sağlık faydalı konu olmuş

Lihtg · 21 Mar 2022

Eline sağlık

'The Wolf · 21 Mar 2022

Windows'da kullanılabilirmi?

Kruvazör · 22 Mar 2022

'The Wolf' Alıntı:
Windows'da kullanılabilirmi?

c# winform ile yaptığım için evet hocam.
Hatta sadece windowsta kullanılabilir

Kruvazör · 22 Mar 2022

Kızıl_Kelebek' Alıntı:
Faydalı bir paylaşım olmuş elinize sağlık.

Ling' Alıntı:
Eline sağlık

Helmsys' Alıntı:
Eline sağlık çok güzel anlatım olmuş. Ezberden kaçınıp resimlerle de somutluk katılmış.

XX07' Alıntı:
Eline Emeğine Sağlık

'CaptainKanka' Alıntı:
Eline sağlık faydalı konu olmuş

Lihtg' Alıntı:
Eline sağlık

sağolun

Mr.Cihangir · 22 Mar 2022

Eline sağlık.

Maveraün Nehr · 6 Nis 2022

Speech recognation ücretli olarak geçiyor bir türlü bulamadım eski versiyonu bulsam da programa enjekte edince hata verdi

Kruvazör · 10 Nis 2022

Maveraun.Nehr' Alıntı:
Speech recognation ücretli olarak geçiyor bir türlü bulamadım eski versiyonu bulsam da programa enjekte edince hata verdi

hocam tam anlayamadım fakat kaynak dosyası işinize yararsa atabilirim.

RasperPascal · 11 Nis 2022

Ellerine sağlık

JANTİŞEYTAN · 11 Nis 2022

Eline emeğine sağlık

C# sesli komut ile uygulama açtırma

Ar-Ge Ekibi Lideri

Harici Saldırı Timleri Koordinatörü

Yeni üye

Ar-Ge Ekibi Lideri

Katılımcı Üye

Üye

Ar-Ge Ekibi Lideri

Üye

Ar-Ge Ekibi Kıdemli

Katılımcı Üye

O Şimdi Asker!

Moderatör

Kıdemli Üye

Ar-Ge Ekibi Lideri

Ar-Ge Ekibi Lideri

Üye

Blue Expert / Head of Malware Team

Ar-Ge Ekibi Lideri

Katılımcı Üye

Üye