Image Home
Image People
Image Publication
Image Applications
Image Data & Code
Image Library
Image Seminar
Image Link
Image Album



Search LAMDA
»

Seminar abstract

Image Classification: From Bag-of-Words to Local Coordinate Coding

Dr. Kai Yu
NEC Laboratories America


Abstract :

In this talk I will outline some research activities at NEC Labs America on image classification and object recognition. We focus on applying linear SVMs on nonlinear encoding of local features to achieve both high accuracy and scalability. The most popular "bag-of-visual-words" representation can be seen as a vector quantization (VQ) coding approach. We generalize VQ to sparse coding and local coordinate coding, and discuss why these unsupervised feature learning methods can help image classification. In the end, I will show some state-of-the-art results on Caltech 101, Caltech 256, and PASCAL VOC data sets, and discuss interesting future work.



Bio:

余凯博士现于NEC美国研究院担任部门主管(Department Head),领导研究院在机器视觉,多媒体处理,和数据挖掘方面的研究与开发。他曾在西门子公司任高级究员 (2004-2006),并在美国加利福尼亚大学SanCruz分校客座讲授研究生课程"数据挖掘"。余博士在机器学习,数据挖掘,信息检索,和机器视觉等领域发表70余篇论文,担任众 多重要国际会议的程序委员,还担任2009年国际机器学习会议(ICML)的Session Chair和2010年国际机器学习会议(ICML)的Area Chair,和美国国家自然基金(NSF)的专家评委。余博士曾获得第9届PKDD国际会议最佳论文奖和1999中国信号处理学会年会最佳论文奖。2009年,他领导的团队在著名的PASCAL VOC视觉识别竞赛中以压倒性优势获得第一名,并在2008年和2009年美国国家技术与标准局组织的TRECVID图像事件检测评比中两次获得第一名。最近他们开发的人脸识别技术于2010年3月被美国主流媒体(如美国有线电视新闻网CNN)和中国中央电视台二套广泛报道。余凯博士毕业于南京大学电子技术与工程系(本科, 1998;硕士, 2000)和德国慕尼黑大学计算机系(博士,2004)。在南大求学期间,他获得吴健雄奖学金,南大学生课外学术作品大赛一等奖,和全国挑战杯三等奖。他是南大德国校友会创办人之一,现任南大旧金山硅谷校友会Vice President.
  Name Size

Image
PoweredBy
(for FireFox 3+ and IE 7+)
Contact LAMDA: (email) contact@lamda.nju.edu.cn (tel) +86-25-89685926. © LAMDA, 2016