midomi-基于声音的搜索

两年前我还在北京的时候,每天上下班要骑42公里的路。在这3小时的时间里,特别是回家路上,可以胡思乱想很多东西。其中的一个胡思乱想还是有点意思的:这是一个搜索引擎的框架,搜索的对象的音乐或者说是声音。但是搜索的方式和传统的相反,是需要你提供一段声音或者音乐,系统返回给你的是这个声音和音乐代表的意义:比如歌曲名;比如语言的意思;比如声音的含义。

这个想法源自自己某时想起一个好听的曲调,可是怎么也想不起这个曲调代表的歌曲。有过这种经历的人可能知道,除了在你身边挨个的问人,互联网起不了什么作用。

然后和几个朋友说起过这么个思路。由于输入的时候都是通过电脑,所以也没有数模转换的要求。最终还是在一个庞大的数字声音波纹数据库中不断优化匹配的算法。话虽如此,一直也没有着手做。一来由于自己的惰性;二来,虽然轻描淡写地可以勾勒出框架,但实际做起来依然还是会差很多。

今天突然看到了aw的一篇博文《革命性的音乐搜索引擎 - midomi(根据您提供的声音来搜索)》,心头顿时一亮,“终于有人做出来了”。

是的,这个网站就是midomi,提供基于声音的搜索。

首先,我们可以看到一个录制的按钮

点击之后,可以看到弹出Flash的对话框,提示是否启用麦克风。

点击允许后,即可录制你需要提供的声音。由于需要匹配数据,所以网站要求至少有10秒的声音上传。

aw在文章里说明了在线录制的实现

作为Flash开发者,值得一提的是,这项伟大的搜索引擎使用的是FlashPlayer目前在Web技术中最大的优势:在线录制(后端需要media server或red5等服务器支持)

在我看来,普通的Web技术在目前的瘦客户端上无法实现在线录制功能。但是即使Flash不支持改功能,也可以通过下载控件的方式实现客户端向服务器端信息传送。当然了,用户体验会相当不好。而其实呢,Flash是保有量最大的控件而已。

由于没有麦克风,让我们来看看aw的测评。

aw同学哼了几句卖报歌(没有歌词,只有曲调),midomi很轻松地找到了:

midomi不是一个纯粹的搜索引擎,声音搜索更多是网站的一项功能。因为虽然声音搜索的用处也可以很多,但是比起常规的搜索来说,依然不够广。加上由于匹配需要采集大量的声音数据,作为社会化网站,网友的共享依然是首位的。这也是为什么midomi最主要的用处在于录制。

在网站的介绍中,midomi把网站的项目主要分成了4类

  1. 搜索
  2. 贡献
  3. 连接
  4. 收集

分别对应了声音搜索、在线音乐录制、社会化网络以及在线数字音乐商店。希望在大量用户被基于声音的搜索吸引后,网站依然可以提供粘度以及赢利点。

在techcrunch查看midomi,居然Michael Arrington 在2007年的1月就介绍了该网站,哎,汗颜啊!


Post a Comment