[1] D. Wang, Z. K. Wang, J. M. Li, B. Zhang, X. R. Li. Query representation by structured concept threads with application to interactive video retrieval, JOURNAL OF VISUAL COMMUNICATION AND IMAGE REPRESENTATION, vol. 20, no. 2, pp. 104-116, 2009
[2] J. H. Yuan, H. Y. Wang, L. Xiao, W. J. Zheng, J. M. Li, F. Z. Lin, B. Zhang. A formal study of shot boundary detection, IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY, vol. 17, no. 2, pp 168-186, 2007
[3] J. H. Yuan, J. M. Li, B. Zhang. Exploiting spatial context constraints for automatic image region annotation, Proceedings of the Fifteenth ACM International Conference on Multimedia (MM 2007), 2007, pp. 595-604
[4] J. H. Yuan, J. M. Li, B. Zhang. Learning concepts from large scale imbalanced data sets using support cluster machines, Proceedings of the 14th Annual ACM International Conference on Multimedia (MM 2006), 2006, pp. 441-450
[5] 李建民, 張鈸, 林福宗. 序貫最小優化的改進算法. 軟件學報. 第14卷, 第5期, 918-924, 2003
研究成果
研究內容集中在視覺信息的分析與檢索,目的是通過機器學習方法提高圖像和視頻檢索的準確率和召回率。我的一些研究成果已經發表在IEEE Transactions on Circuits and Systems for Video Technology等期刊和ACM Multimedia等會議上。
針對視覺信息分析,我提出了利用boost框架、融合豐富特征進行語義建模的方法和以結構預測的觀點、利用空間上下文進行區域標注的方法。在檢索方面,我提出了從查詢和反饋中抽取用戶信息需求的方法。另外,我提出了針對SVM的快速訓練和預測方法,以支持實時交互的視頻檢索;我還提出了面向大規模高維數據的高效索引方法。
基于上述方法構建的視覺信息分析系統,在TRECVID(基于內容的視頻檢索領域的權威評測)中多次取得最佳性能。同時,我提出的算法已經應用在互聯網視聽節目監管系統中,并在全國多個部委和省份部署。