<html><head></head><body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; ">Yeah. &nbsp;Trying to define music is essentially pointless. &nbsp;Defining speech would be easier.<div><br></div><div>However, since you mentioned neural nets, you could try to train a net on speech and music (there's an ANN object out there that I've tested) and see what happens. &nbsp;That would be a fun experiment, no idea how well it would work... &nbsp;you'd need a pretty huge training set for it to be even remotely (I would think).</div><div><br></div><div>——t3db0t<br><div><br><div><div>On Feb 7, 2011, at 1:38 PM, Pedro Lopes wrote:</div><br class="Apple-interchange-newline"><blockquote type="cite">First of all, I would take it from another angle:<div><br></div><div>&lt;this is one possible way, out of zillions&gt;</div><div>if it is speech or not. Thus if the speech recognizer has X % of recogniztion rate, you inherit that percentage. Now you heavily depend on the recognizer, some recognizers like teh default windows try to always match the input to some string, thus they are a bit of garbage in academic terms, what you need is a strong open recognizer that can tell you how % similar the sentence is to a target sentence in database.&nbsp;<br>

<br></div><div>Why do I suggest this angle?</div><div>- Cause' I don't wanna think "what is music". Speech is a language, it is defined, it easy structured. Music? Noise is music, drone is music, ambient can be non&nbsp;rhythmical, what about an a&nbsp;Capella&nbsp;singing? Will it be music? and all those inherited&nbsp;philosophical&nbsp;issues. Furthermore, if you need more help maybe explaining the context will aid us, because if you only care for certain "music" can be easier. ALSO: if you have access the audio data, you can&nbsp;always&nbsp;extract (filter) the music.&nbsp;</div>

<div><br></div><div>&lt;/this is one possible way, out of zillions&gt;</div><div><br></div><div>best,</div><div>pedro</div><div><br></div><div><br><div class="gmail_quote">

On Mon, Feb 7, 2011 at 5:43 PM, patrick <span dir="ltr">&lt;<a href="mailto:puredata@11h11.com">puredata@11h11.com</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;">

would it be possible to detect if the incoming audio is music or speech? i guess it's very hard, but i was thinking about some methods:<br>
<br>
using some kind of frequency detection<br>
using bonk (if the tempo is stable = music)<br>
env~ (most music are compressed nowadays)<br>
training a voice (using neural network?!?)<br>
<br>
<br>
From the author of aubio:<br>
Use a few low level features, such as energy of low and high frequencies bands, spectral spread. In a second step, these approaches are often refined using machine learning techniques bayesian networks or support vector machines.<br>


<br>
See for instance these papers:<br>
<a href="http://cobweb.ecn.purdue.edu/~malcolm/interval/1996-085/" target="_blank">http://cobweb.ecn.purdue.edu/~malcolm/interval/1996-085/</a><br>
<a href="http://www.aclweb.org/anthology/O/O08/O08-1015.pdf" target="_blank">http://www.aclweb.org/anthology/O/O08/O08-1015.pdf</a><br>
<a href="http://www.hindawi.com/journals/asp/2009/628570.html" target="_blank">http://www.hindawi.com/journals/asp/2009/628570.html</a><br>
<br>
i would like to achieve &gt; 90% of accuracy if possible. any suggestions are welcome!<br>
<br>
_______________________________________________<br>
<a href="mailto:Pd-list@iem.at" target="_blank">Pd-list@iem.at</a> mailing list<br>
UNSUBSCRIBE and account-management -&gt; <a href="http://lists.puredata.info/listinfo/pd-list" target="_blank">http://lists.puredata.info/listinfo/pd-list</a><br>
</blockquote></div><br><br clear="all"><br>-- <br>Pedro Lopes (MSc)<br>contact: <a href="mailto:pedro.lopes@ist.utl.pt" target="_blank">pedro.lopes@ist.utl.pt</a><br>website:&nbsp;<a href="http://web.ist.utl.pt/Pedro.Lopes" target="_blank">http://web.ist.utl.pt/Pedro.Lopes</a>&nbsp;/&nbsp;<a href="http://pedrolopesresearch.wordpress.com/" target="_blank">http://pedrolopesresearch.wordpress.com/</a>&nbsp;|&nbsp;<a href="http://twitter.com/plopesresearch" target="_blank">http://twitter.com/plopesresearch</a><br>


</div>
_______________________________________________<br><a href="mailto:Pd-list@iem.at">Pd-list@iem.at</a> mailing list<br>UNSUBSCRIBE and account-management -&gt; <a href="http://lists.puredata.info/listinfo/pd-list">http://lists.puredata.info/listinfo/pd-list</a><br></blockquote></div><br></div></div></body></html>