首页 > 代码库 > 计算机视觉整理库
计算机视觉整理库
本文章有转载自其它博文,也有自己发现的新库添加进来的,如果发现有新的库,可以推荐我加进来
转自:http://www.cnblogs.com/tornadomeet/archive/2012/05/24/2515980.html
Deep Learning(深度学习):
ufldl的2个教程(这个没得说,入门绝对的好教程,Ng的,逻辑清晰有练习):一
ufldl的2个教程(这个没得说,入门绝对的好教程,Ng的,逻辑清晰有练习):二
Bengio团队的deep learning教程,用的theano库,主要是rbm系列,搞python的可以参考,很不错。
deeplearning.net主页,里面包含的信息量非常多,有software, reading list, research lab, dataset, demo等,强烈推荐,自己去发现好资料。
Deep learning的toolbox,matlab实现的,对应源码来学习一些常见的DL模型很有帮助,这个库我主要是用来学习算法实现过程的。
2013年龙星计划深度学习教程,邓力大牛主讲,虽然老师准备得不充分,不过还是很有收获的。
Hinton大牛在coursera上开的神经网络课程,DL部分有不少,非常赞,没有废话,课件每句话都包含了很多信息,有一定DL基础后去听收获更大。
Larochelle关于DL的课件,逻辑清晰,覆盖面广,包含了rbm系列,autoencoder系列,sparse coding系列,还有crf,cnn,rnn等。虽然网页是法文,但是课件是英文。
CMU大学2013年的deep learning课程,有不少reading paper可以参考。
达慕思大学Lorenzo Torresani的2013Deep learning课程reading list.
Deep Learning Methods for Vision(余凯等在cvpr2012上组织一个workshop,关于DL在视觉上的应用)。
斯坦福Ng团队成员链接主页,可以进入团队成员的主页,比较熟悉的有Richard Socher, Honglak Lee, Quoc Le等。
多伦多ML团队成员链接主页,可以进入团队成员主页,包括DL鼻祖hinton,还有Ruslan Salakhutdinov , Alex Krizhevsky等。
蒙特利尔大学机器学习团队成员链接主页,包括大牛Bengio,还有Ian Goodfellow 等。
纽约大学的机器学习团队成员链接主页,包括大牛Lecun,还有Rob Fergus等。
Charlie Tang个人主页,结合DL+SVM.
豆瓣上的脑与deep learning读书会,有讲义和部分视频,主要介绍了一些于deep learning相关的生物神经网络。
Large Scale ML的课程,由Lecun和Langford讲的,能不推荐么。
Yann Lecun的2014年Deep Learning课程主页。视频链接。
吴立德老师《深度学习课程》
一些常见的DL code列表,csdn博主zouxy09的博文,Deep Learning源代码收集-持续更新…
Deep Learning for NLP (without Magic),由DL界5大高手之一的Richard Socher小组搞的,他主要是NLP的。
2012 Graduate Summer School: Deep Learning, Feature Learning,高手云集,深度学习盛宴,几乎所有的DL大牛都有参加。
matlab下的maxPooling速度优化,调用C++实现的。
2014年ACL机器学习领域主席Kevin Duh的深度学习入门讲座视频。
R-CNN code: Regions with Convolutional Neural Network Features.
Machine Learning(机器学习):
介绍图模型的一个ppt,非常的赞,ppt作者总结得很给力,里面还包括了HMM,MEM, CRF等其它图模型。反正看完挺有收获的。
机器学习一个视频教程,youtube上的,翻吧,内容很全面,偏概率统计模型,每一小集只有几分钟。
龙星计划2012机器学习,由余凯和张潼主讲。
demonstrate 的 blog :关于PGM(概率图模型)系列,主要按照Daphne Koller的经典PGM教程介绍的,大家依次google之。
FreeMind的博客,主要关于机器学习的。
Tom Mitchell大牛的机器学习课程,他的machine learning教科书非常出名。
CS109,Data Science,用python介绍机器学习算法的课程。
CCF主办的一些视频讲座。
国外技术团队博客:
Netflix技术博客,很多干货。
Computer Vision(计算机视觉):
MIT2013年秋季课程:Advances in Computer Vision,有练习题,有些有code.
IPAM一个计算机视觉的短期课程,有不少牛人参加。
OpenCV相关:
http://opencv.org/
2012年7月4日随着opencv2.4.2版本的发布,opencv更改了其最新的官方网站地址。
http://www.opencvchina.com/
好像12年才有这个论坛的,比较新。里面有针对《learning opencv》这本书的视频讲解,不过视频教学还没出完,正在更新中。对刚入门学习opencv的人来说很不错。
http://www.opencv.org.cn/forum/
opencv中文论坛,对于初次接触opencv的学者来说比较不错,入门资料多,opencv的各种英文文档也翻译成中文了。不足是感觉这个论坛上发帖提问很少人回答,也就是说讨论不够激烈。
http://opencv.jp/
opencv的日文网站,里面有不少例子代码,看不懂日文可以用网站自带的翻译,能看个大概。
http://code.opencv.org/projects/opencv
opencv版本bug修补,版本更新,以及各种相关大型活动安排,还包含了opencv最近几个月内的活动路线,即未来将增加的功能等,可以掌握各种关于opencv进展情况的最新进展。
http://tech.groups.yahoo.com/group/OpenCV/
opencv雅虎邮件列表,据说是最好的opencv论坛,信息更新最新的地方。不过个人认为要查找相关主题的内容,在邮件列表中非常不方便。
http://www.cmlab.csie.ntu.edu.tw/~jsyeh/wiki/doku.php
台湾大学暑假集训网站,内有链接到与opencv集训相关的网页。感觉这种教育形式还蛮不错的。
http://sourceforge.net/projects/opencvlibrary/
opencv版本发布地方。
http://code.opencv.org/projects/opencv/wiki/ChangeLog#241http://opencv.willowgarage.com/wiki/OpenCV%20Change%20Logs
opencv版本内容更改日志网页,前面那个网页更新最快。
http://www.opencv.org.cn/opencvdoc/2.3.2/html/doc/tutorials/tutorials.html
opencv中文教程网页,分几个模块讲解,有代码有过程。内容是网友翻译opencv自带的doc文件里的。
https://netfiles.uiuc.edu/jbhuang1/www/resources/vision/index.html
网友总结的常用带有cvpr领域常见算法code链接的网址,感觉非常的不错。
http://fossies.org/dox/OpenCV-2.4.2/
该网站可以查看opencv中一些函数的变量接口,还会列出函数之间的结构图。
http://opencv.itseez.com/
opencv的函数、类等查找网页,有导航,查起来感觉不错。
优化:
submodual优化网页。
Geoff Gordon的优化课程,youtube上有对应视频。
数学:
http://www.youku.com/playlist_show/id_19465801.html
《计算机中的数学》系列视频,8位老师10讲内容,生动介绍微积分和线性代数基本概念在计算机学科中的各种有趣应用!
Linux学习资料:
http://itercast.com/library/1
linux入门的基础视频教程,对于新手可选择看第一部分,视频来源于LinuxCast.net网站,还不错。
OpenNI+Kinect相关:
http://1.yuhuazou.sinaapp.com/
网友晨宇思远的博客,主攻cvpr,ai等。
http://blog.csdn.net/chenli2010/article/details/6887646
kinect和openni学习资料汇总。
http://blog.csdn.net/moc062066/article/category/871261
OpenCV 计算机视觉 kinect的博客:
http://kheresy.wordpress.com/index_of_openni_and_kinect/comment-page-5/
网友Heresy的博客,里面有不少kinect的文章,写的比较详细。
http://www.cnkinect.com/
体感游戏中文网,有不少新的kinect资讯。
http://www.kinectutorial.com/
Kinect体感开发网。
http://code.google.com/p/openni-hand-tracker
openni_hand_tracking google code项目。
http://blog.candescent.ch/
网友的kinect博客,里面有很多手势识别方面的文章介绍,还有源码,不过貌似是基于c#的。
https://sites.google.com/site/colordepthfusion/
一些关于深度信息和颜色信息融合(fusion)的文章。
http://projects.ict.usc.edu/mxr/faast/
kinect新的库,可以结合OpenNI使用。
https://sites.google.com/a/chalearn.org/gesturechallenge/
kinect手势识别网站。
http://www.ros.org/wiki/mit-ros-pkg
mit的kinect项目,有code。主要是与手势识别相关。
http://www.thoughtden.co.uk/blog/2012/08/kinecting-people-our-top-6-kinect-projects/
kinect 2012年度最具创新的6个项目,有视频,确实够创新的!
http://www.cnblogs.com/yangyangcv/archive/2011/01/07/1930349.html
kinect多点触控的一篇博文。
http://sourceforge.net/projects/kinect-mex/
http://www.mathworks.com/matlabcentral/fileexchange/30242-kinect-matlab
有关matlab for kinect的一些接口。
http://news.9ria.com/2012/1212/25609.html
AIR和Kinect的结合,有一些手指跟踪的code。
http://eeeweba.ntu.edu.sg/computervision/people/home/renzhou/index.htm
研究kinect手势识别的,任洲。刚毕业不久。
其他网友cvpr领域的链接总结:
http://www.cnblogs.com/kshenf/
网友整理常用牛人链接总结,非常多。不过个人没有没有每个网站都去试过。所以本文也是我自己总结自己曾经用过的或体会过的。
OpenGL有关:
http://nehe.gamedev.net/
NeHe的OpenGL教程英文版。
http://www.owlei.com/DancingWind/
NeHe的OpenGL教程对应的中文版,由网友周玮翻译的。
http://www.qiliang.net/old/nehe_qt/
NeHe的OpengGL对应的Qt版中文教程。
http://blog.csdn.net/qp120291570
网友"左脑设计,右脑编程"的Qt_OpenGL博客,写得还不错。
http://guiliblearning.blogspot.com/
这个博客对opengl的机制有所剖析,貌似要FQ才能进去。
cvpr综合网站论坛博客等:
http://www.cvchina.net/
中国计算机视觉论坛
http://www.cvchina.info/
这个博客很不错,每次看完都能让人兴奋,因为有很多关于cv领域的科技新闻,还时不时有视频显示。另外这个博客里面的资源也整理得相当不错。中文的。
http://www.bfcat.com/
一位网友的个人计算机视觉博客,有很多关于计算机视觉前沿的东西介绍,与上面的博客一样,看了也能让人兴奋。
http://blog.csdn.net/v_JULY_v/
牛人博客,主攻数据结构,机器学习数据挖掘算法等。
http://blog.youtueye.com/
该网友上面有一些计算机视觉方向的博客,博客中附有一些实验的测试代码.
http://blog.sciencenet.cn/u/jingyanwang
多看pami才扯谈的博客,其中有不少pami文章的中文介绍。
http://chentingpc.me/
做网络和自然语言处理的,有不少机器学习方面的介绍。
ML常用博客资料等:
http://freemind.pluskid.org/
由 pluskid 所维护的 blog,主要记录一些机器学习、程序设计以及各种技术和非技术的相关内容,写得很不错。
http://datasciencemasters.org/
里面包含学ML/DM所需要的一些知识链接,且有些给出了视频教程,网页资料,电子书,开源code等,推荐!
http://cs.nju.edu.cn/zhouzh/index.htm
周志华主页,不用介绍了,机器学习大牛,更可贵的是他的很多文章都有源码公布。
http://www.eecs.berkeley.edu/~jpaisley/Papers.htm
John Paisley的个人主页,主要研究机器学习领域,有些文章有代码提供。
http://foreveralbum.yo2.cn/
里面有一些常见机器学习算法的详细推导过程。
http://blog.csdn.net/abcjennifer
浙江大学CS硕士在读,关注计算机视觉,机器学习,算法研究,博弈, 人工智能, 移动互联网等学科和产业。该博客中有很多机器学习算法方面的介绍。
http://www.wytk2008.net/
无垠天空的机器学习博客。
http://www.chalearn.org/index.html
机器学习挑战赛。
http://licstar.net/
licstar的技术博客,偏自然语言处理方向。
国内科研团队和牛人网页:
http://vision.ia.ac.cn/zh/index_cn.html
中科院自动化所机器视觉课题小组,有相关数据库、论文、课件等下载。
http://www.cbsr.ia.ac.cn/users/szli/
李子青教授个人主页,中科院自动化所cvpr领域牛叉人!
http://www4.comp.polyu.edu.hk/~cslzhang/
香港理工大学教授lei zhang个人主页,也是cvpr领域一大牛人啊,cvpr,iccv各种发表。更重要的是他所以牛叉论文的code全部公开,非常难得!
http://liama.ia.ac.cn/wiki/start
中法信息、自动化与应用联合实验室,里面很多内容不仅限而cvpr,还有ai领域一些其他的研究。
http://www.cogsci.xmu.edu.cn/cvl/english/
厦门大学特聘教授,cv领域一位牛人。研究方向主要为目标检测,目标跟踪,运动估计,三维重建,鲁棒统计学,光流计算等。
http://idm.pku.edu.cn/index.aspx
北京大学数字视频编码技术国家实验室。
http://www.csie.ntu.edu.tw/~cjlin/libsvm/
libsvm项目网址,台湾大学的,很火!
http://www.jdl.ac.cn/user/sgshan/index.htm
山世光,人脸识别研究比较牛。在中国科学院智能信息处理重点实验室
国外科研团队和牛人网页:
https://netfiles.uiuc.edu/jbhuang1/www/resources/vision/index.html
常见计算机视觉资源整理索引,国外学者整理,全是出名的算法,并且带有代码的,这个非常有帮助,其链接都是相关领域很火的代码。
http://www.cs.cmu.edu/afs/cs/project/cil/ftp/html/txtv-groups.html
国外学者整理的各高校研究所团队网站
http://research.microsoft.com/en-us/groups/vision/
微软视觉研究小组,不解释,大家懂的,牛!
http://lear.inrialpes.fr/index.php
法国国家信息与自动化研究所,有对应牛人的链接,论文项目网页链接,且一些code对应链接等。
http://www.cs.ubc.ca/~pcarbo/objrecls/
Learning to recognize objects with little supervision该篇论文的项目网页,有对应的code下载,另附有详细说明。
http://www.eecs.berkeley.edu/~lbourdev/poselets/
poselets相关研究界面,关于poselets的第一手资料。
http://www.cse.oulu.fi/CMV/Research
芬兰奥卢大学计算机科学与工程学院网页,里面有很多cv领域相关的研究,比如说人脸,脸部表情,人体行为识别,跟踪,人机交互等cv基本都涉及有。
http://www.cs.cmu.edu/~cil/vision.html
卡耐基梅隆大学计算机视觉主页,内容非常多。可惜的是该网站内容只更新到了2004年。
http://vision.stanford.edu/index.html
斯坦福大学计算机视觉主页,里面有非常非常多的牛人,比如说大家熟悉的lifeifei.
http://www.wavelet.org/index.php
关于wavelet研究的网页。
http://civs.ucla.edu/
加州大学洛杉矶分校统计学院,关于统计学习方面各种资料,且有相应的网上公开课。
http://www.cs.cmu.edu/~efros/
卡耐基梅隆大学Alexei(Alyosha)Efros教授个人网站,计算机图形学高手。
http://web.mit.edu/torralba/www//
mit牛人Associate教授个人网址,主要研究计算机视觉人体视觉感知,目标识别和场景理解等。
http://people.csail.mit.edu/billf/
mit牛人William T. Freeman教授,主要研究计算机视觉和图像学
http://www.research.ibm.com/peoplevision/
IBM人体视觉研究中心,里面除了有其研究小组的最新成果外,还有很多测试数据(特别是视频)供下载。
http://www.vlfeat.org/
vlfeat主页,vlfeat也是一个开源组织,主要定位在一些最流行的视觉算法开源上,C编写,其很多算法效果比opencv要好,不过数量不全,但是非常有用。
http://www.robots.ox.ac.uk/~az/
Andrew Zisserman的个人主页,这人大家应该熟悉,《计算机视觉中的多视几何》这本神书的作者之一。
http://www.cs.utexas.edu/~grauman/
KristenGrauman教授的个人主页,是个大美女,且是2011年“马尔奖”获得者,”马尔奖“大家都懂的,计算机视觉领域的最高奖项,目前无一个国内学者获得过。她的主要研究方法是视觉识别。
http://groups.csail.mit.edu/vision/welcome/
mit视觉实验室主页。
http://code.google.com/p/sixthsense/
曾经在网络上非常出名一个视频,一个作者研究的第六感装置,现在这个就是其开源的主页。
http://vision.ucsd.edu/~pdollar/research.html#BehaviorRecognitionAnimalBehavior
Piotr Dollar的个人主要,主要研究方向是人体行为识别。
http://www.mmp.rwth-aachen.de/
移动多媒体处理,将移动设备,计算机图像学,视觉,图像处理等结合的领域。
http://www.di.ens.fr/~laptev/index.html
Ivan Laptev牛人主页,主要研究人体行为识别。有很多数据库可以下载。
http://blogs.oregonstate.edu/hess/
Rob Hess的个人主要,里面有源码下载,比如说粒子滤波,他写的粒子滤波在网上很火。
http://morethantechnical.googlecode.com/svn/trunk/
cvpr领域一些小型的开源代码。
http://iica.de/pd/index.py
做行人检测的一个团队,内部有一些行人检测的代码下载。
http://www.cs.utexas.edu/~grauman/research/pubs.html
UT-Austin计算机视觉小组,包含的视觉研究方向比较广,且有的文章有源码,你只需要填一个邮箱地址,系统会自动发跟源码相关的信息过来。
http://www.robots.ox.ac.uk/~vgg/index.html
visual geometry group
图像:
http://blog.sina.com.cn/s/blog_4cccd8d301012pw5.html
交互式图像分割代码。
http://vision.csd.uwo.ca/code/
graphcut优化代码。
语音:
http://danielpovey.com/kaldi-lectures.html
语音处理中的kaldi学习。
算法分析与设计(计算机领域的基础算法):
http://www.51nod.com/focus.html
该网站主要是讨论一些算法题。里面的李陶冶是个大牛,回答了很多算法题。
一些综合topic列表:
http://www.cs.cornell.edu/courses/CS7670/2011fa/
计算机视觉中的些topic(Special Topics in Computer Vision),截止到2011年为止,其引用的文章都是非常顶级的topic。
书籍相关网页:
http://www.imageprocessingplace.com/index.htm
冈萨雷斯的《数字图像处理》一书网站,包含课程材料,matlab图像处理工具包,课件ppt等相关素材。
Consumer Depth Cameras for Computer Vision
很优秀的一本书,不过很贵,买不起啊!做深度信息的使用这本书还不错,google图中可以预览一部分。
Making.Things.See
针对Kinect写的,主要关注深度信息,较为基础。书籍中有不少例子,貌似是java写的。
国内一些AI相关的研讨会:
http://www.iipl.fudan.edu.cn/MLA13/index.htm
中国机器学习及应用研讨会(这个是2013年的)
期刊会议论文下载:
http://cvpapers.com/
几个顶级会议论文公开下载界面,比如说ICCV,CVPR,ECCV,ACCV,ICPR,SIGGRAPH等。
http://www.cvpr2012.org/
cvpr2012的官方地址,里面有各种资料和信息,其他年份的地址类似推理更改即可。
http://www.sciencedirect.com/science/journal/02628856
ICV期刊下载
http://www.computer.org/portal/web/tpami
TPAMI期刊,AI领域中可以算得上是最顶级的期刊了,里面有不少cvpr方面的内容。
http://www.springerlink.com/content/100272/
IJCV的网址。
http://books.nips.cc/
NIPS官网,有论文下载列表。
http://graphlab.org/lsrs2013/program/
LSRS (会议)地址,大规模推荐系统,其它年份依次类推。
会议期刊相关信息:
http://conferences.visionbib.com/Iris-Conferences.html
该网页列出了图像处理,计算机视觉领域相关几乎所有比较出名的会议时间表。
http://conferences.visionbib.com/Browse-conf.php
上面网页的一个子网页,列出了最近的CV领域提交paper的deadline。
cvpr相关数据库下载:
http://research.microsoft.com/en-us/um/people/jckrumm/WallFlower/TestImages.htm
微软研究院牛人Wallflower Paper的论文中用到的目标检测等测试图片
http://archive.ics.uci.edu/ml/
UCI数据库列表下载,最常用的机器学习数据库列表。
http://www.cs.rochester.edu/~rmessing/uradl/
人体行为识别通过关键点的跟踪视频数据库,Rochester university的
http://www.research.ibm.com/peoplevision/performanceevaluation.html
IBM人体视觉研究中心,有视频监控等非常多的测试视频。
http://www.cvpapers.com/datasets.html
该网站上列出了常见的cvpr研究的数据库。
http://www.cs.washington.edu/rgbd-dataset/index.html
RGB-D Object Dataset.做目标识别的。
AI相关娱乐网页:
http://en.akinator.com/
该网站很好玩,可以测试你心里想出的一个人名(当然前提是这个人必须有一定的知名度),然后该网站会提出一系列的问题,你可以选择yes or no,or I don’t know等等,最后系统会显示你心中所想的那个人。
http://www.doggelganger.co.nz/
人与狗的匹配游戏,摄像头采集人脸,呵呵…
Android相关:
https://code.google.com/p/android-ui-utils/
该网站上有一些android图标,菜单等跟界面有关的设计工具,可以用来做一些简单的UI设计.
工具和code下载:
http://lear.inrialpes.fr/people/dorko/downloads.html
6种常见的图像特征点检测子,linux下环境运行。不过只提供了二进制文件,不提供源码。
http://www.cs.ubc.ca/~pcarbo/objrecls/index.html#code
ssmcmc的matlab代码,是Learning to recognize objects with little supervision这一系列文章用的源码,属于目标识别方面的研究。
http://www.robots.ox.ac.uk/~timork/
仿射无关尺度特征点检测算子源码,还有些其它算子的源码或二进制文件。
http://www.vision.ee.ethz.ch/~bleibe/code/ism.html
隐式形状模型(ISM)项目主页,作者Bastian Leibe提供了linux下运行的二进制文件。
http://www.di.ens.fr/~laptev/download.html#stip
Ivan Laptev牛人主页中的STIP特征点检测code,但是也只是有二进制文件,无源码。该特征点在行为识别中该特征点非常有名。
http://ai.stanford.edu/~quocle/
斯坦福大学Quoc V.Le主页,上有它2011年行为识别文章的代码。
开源软件:
http://mloss.org/software/
一些ML开源软件在这里基本都可以搜到,有上百个。
https://github.com/myui/hivemall
Scalable machine learning library for Hive/Hadoop.
http://scikit-learn.org/stable/
基于python的机器学习开源软件,文档写得不错。
挑战赛:
http://www.chioka.in/kaggle-competition-solutions/
kaggle一些挑战赛的code.
公开课:
网易公开课,国内做得很不错的公开课,翻译了一些国外出名的公开课教程,与国外公开课平台coursera有合作。
coursera在线教育网上公开课,很新,有个邮箱注册即可学习,有不少课程,且有对应的练习,特别是编程练习,超赞。
斯坦福网上公开课链接,有统计学习,凸优化等课程。
udacity公开课程下载链接,其实速度还可以。里面有不少好教程。
机器学习公开课的连接,有不少课。
转自:http://blog.csdn.net/tainyiliusha/article/details/10077081
开源生物特征识别库 OpenBR
OpenBR 是一个用来从照片中识别人脸的工具。还支持推算性别与年龄。 使用方法:$ br -algorithm FaceRecognition -compare me.jpg you.jpg更多OpenBR信息
最近更新: OpenBR —— 开源的生物识别工具 发布于 13天前
计算机视觉库 OpenCV
OpenCV是Intel®开源计算机视觉库。它由一系列 C 函数和少量 C++ 类构成,实现了图像处理和计算机视觉方面的很多通用算法。 OpenCV 拥有包括 300 多个C函数的跨平台的中、高层 API。它不依赖于其它的外部库——尽管也可以使用某些外部库。 OpenCV 对非商业...更多OpenCV信息
最近更新: OpenCV 2.4.5 发布,开源计算机视觉库 发布于 2个月前
人脸识别 faceservice.cgi
faceservice.cgi 是一个用来进行人脸识别的 CGI 程序, 你可以通过上传图像,然后该程序即告诉你人脸的大概坐标位置。faceservice是采用 OpenCV 库进行开发的。更多faceservice.cgi信息
Java视觉处理库 JavaCV
JavaCV 提供了在计算机视觉领域的封装库,包括:OpenCV、ARToolKitPlus、libdc1394 2.x 、PGR FlyCapture和FFmpeg。此外,该工具可以很容易地使用Java平台的功能。 JavaCV还带有硬件加速的全屏幕图像显示(CanvasFrame),易于在多个内核中执行并行代码(并...更多JavaCV信息
视频监控系统 OpenVSS
OpenVSS - 开放平台的视频监控系统 - 是一个系统级别的视频监控软件视频分析框架(VAF)的视频分析与检索和播放服务,记录和索引技术。它被设计成插件式的支持多摄像头平台,多分析仪模块(OpenCV的集成),以及多核心架构。更多OpenVSS信息
OpenCV的.NET版 OpenCVDotNet
OpenCVDotNet 是一个 .NET 对 OpenCV 包的封装。更多OpenCVDotNet信息
人脸检测算法 jViolajones
jViolajones是人脸检测算法Viola-Jones的一个Java实现,并能够加载OpenCV XML文件。 示例代码:http://www.oschina.net/code/snippet_12_2033更多jViolajones信息
手势识别 hand-gesture-detection
手势识别,用OpenCV实现更多hand-gesture-detection信息
人脸检测与跟踪库 asmlibrary
Active Shape Model Library (ASMLibrary©) SDK, 用OpenCV开发,用于人脸检测与跟踪。更多asmlibrary信息
开放模式识别项目 OpenPR
Pattern Recognition project(开放模式识别项目),致力于开发出一套包含图像处理、计算机视觉、自然语言处理、模式识别、机器学习和相关领域算法的函数库。更多OpenPR信息
运动检测程序 QMotion
QMotion 是一个采用 OpenCV 开发的运动检测程序,基于 QT。更多QMotion信息
图像特征提取 cvBlob
cvBlob 是计算机视觉应用中在二值图像里寻找连通域的库.能够执行连通域分析与特征提取.更多cvBlob信息
OpenCV的.Net封装 OpenCVSharp
OpenCVSharp 是一个OpenCV的.Net wrapper,应用最新的OpenCV库开发,使用习惯比EmguCV更接近原始的OpenCV,有详细的使用样例供参考。更多OpenCVSharp信息
人脸检测识别 mcvai-tracking
提供人脸检测、识别与检测特定人脸的功能,示例代码 cvReleaseImage( &gray ); cvReleaseMemStorage(&storage); cvReleaseHaarClassifierCascade(&cascade);...更多mcvai-tracking信息
视频捕获 API VideoMan
VideoMan 提供一组视频捕获 API 。支持多种视频流同时输入(视频传输线、USB摄像头和视频文件等)。能利用 OpenGL 对输入进行处理,方便的与 OpenCV,CUDA 等集成开发计算机视觉系统。更多VideoMan信息
基于QT的计算机视觉库 QVision
基于 QT 的面向对象的多平台计算机视觉库。可以方便的创建图形化应用程序,算法库主要从 OpenCV,GSL,CGAL,IPP,Octave 等高性能库借鉴而来。更多QVision信息
开源视线跟踪软件 ITU Gaze Tracker
哥本哈根大学开源视线跟踪软件 The ITU Gaze Tracker is an open-source eye tracker that aims to provide a low-cost alternative to commercial gaze tracking systems and to make this technology more accessible. It is developed by the Gaze Grou...更多ITU Gaze Tracker信息
图像处理和计算机视觉常用算法库 LTI-Lib
LTI-Lib 是一个包含图像处理和计算机视觉常用算法和数据结构的面向对象库,提供 Windows 下的 VC 版本和 Linux 下的 gcc 版本,主要包含以下几方面内容: 1、线性代数 2、聚类分析 3、图像处理 4、可视化和绘图工具更多LTI-Lib信息
实时图像/视频处理滤波开发包 GShow
GShow is a real-time image/video processing filter development kit. It successfully integrates DirectX11 with DirectShow framework. So it has the following features: GShow 是实时 图像/视频 处理滤波开发包,集成DiretX11。...更多GShow信息
C++计算机视觉库 Integrating Vision Toolkit
Integrating Vision Toolkit (IVT) 是一个强大而迅速的C++计算机视觉库,拥有易用的接口和面向对象的架构,并且含有自己的一套跨平台GUI组件,另外可以选择集成OpenCV
OpenCV的Python封装 pyopencv
OpenCV的Python封装,主要特性包括: 提供与OpenCV 2.x中最新的C++接口极为相似的Python接口,并且包括C++中不包括的C接口 提供对OpenCV 2.x中所有主要部件的绑定:CxCORE (almost complete), CxFLANN (complete), Cv (complete), CvAux (C++ part almost...更多pyopencv信息
模式识别和视觉库 RAVL
Recognition And Vision Library (RAVL) 是一个通用 C++ 库,包含计算机视觉、模式识别等模块。更多RAVL信息
OpenSURF
利用OpenCV和C++编写的SURF算法,作者Christopher Evans是首个利用OpenCV和C++结合的方法实现SURF算法。更多OpenSURF信息
人脸识别库 rpflex
rpflex 是一个 Flex 开发的库,用来识别照片中的人脸、眼镜和脖子。更多rpflex信息
OpenCV优化 opencv-dsp-acceleration
优化了OpenCV库在DSP上的速度。更多opencv-dsp-acceleration信息
Java 计算机视觉库 BoofCV
BoofCV 是一个 Java 的全新实时的计算机视觉库,BoofCV 易于使用而且具有非常高的性能。它提供了一系列从低层次的图像处理、小波去噪功能以及更高层次的三维几何视野。使用 BSD 许可证可在商业应用中使用。 这里有篇英文文章用来介绍 BoofCV 的使用。...更多BoofCV信息
计算机视觉库 SimpleCV
SimpleCV 将很多强大的开源计算机视觉库包含在一个便捷的Python包中。使用SimpleCV,你可以在统一的框架下使用高级算法,例如特征检测、滤波和模式识别。使用者不用清楚一些细节,比如图像比特深度、文件格式、颜色空间、缓冲区管理、特征值还有矩阵和图像...更多SimpleCV信息
3D视觉库 fvision2010
基于OpenCV构建的图像处理和3D视觉库。 示例代码: ImageSequenceReaderFactory factory; ImageSequenceReader* reader = factory.pathRegex("c:/a/im_%03d.jpg", 0, 20); //ImageSequenceReader* reader = factory.avi("a.avi"); if (reader == NULL) { ...更多fvision2010信息
视觉快速开发平台 qcv
计算机视觉快速开发平台,提供测试框架,使开发者可以专注于算法研究。更多qcv信息
计算机视觉算法 OpenVIDIA
OpenVIDIA projects implement computer vision algorithms running on on graphics hardware such as single or multiple graphics processing units(GPUs) using OpenGL, Cg and CUDA-C. Some samples will soon support OpenCL and Direct Compute API‘...更多OpenVIDIA信息
C++计算机视觉库 ICL
ICL (Image Component Library) 是一种新型的C + +计算机视觉库,由比勒费尔德大学神经信息学组和CITEC开发。它兼顾了性能和用户友好性。 ICL提供了一个易于使用的类和函数的集合,可以开发复杂的计算机视觉应用。 在不到15行的C + +代码(见例子)可以写成...更多ICL信息
Matlab计算机视觉包 mVision
Matlab 的计算机视觉包,包含用于观察结果的 GUI 组件,貌似也停止开发了,拿来做学习用挺不错的。更多mVision信息
Lua视觉开发库 libecv
ECV 是 lua 的计算机视觉开发库(目前只提供linux支持)更多libecv信息
OpenCV的扩展库 ImageNets
ImageNets 是对OpenCV 的扩展,提供对机器人视觉算法方面友好的支持,使用Nokia的QT编写界面。更多ImageNets信息
图像捕获 libv4l2cam
对函数库v412的封装,从网络摄像头等硬件获得图像数据,支持YUYV裸数据输出和BGR24的OpenCV IplImage输出更多libv4l2cam信息
高斯模型点集配准算法 gmmreg
实现了基于混合高斯模型的点集配准算法,该算法描述在论文: A Robust Algorithm for Point Set Registration Using Mixture of Gaussians, Bing Jian and Baba C. Vemuri. ,实现了C++/Matlab/Python接口...更多gmmreg信息
Scilab的计算机视觉库 SIP
SIP 是 Scilab(一种免费的类Matlab编程环境)的图像处理和计算机视觉库。SIP 可以读写 JPEG/PNG/BMP 格式的图片。具备图像滤波、分割、边缘检测、形态学处理和形状分析等功能。更多SIP信息
计算机视觉和机器人技术的工具包 EGT
The Epipolar Geometry Toolbox (EGT) is a toolbox designed for Matlab (by Mathworks Inc.). EGT provides a wide set of functions to approach computer vision and robotics problems with single and multiple views, and with different vision se...更多EGT信息
计算机视觉库 BazAR
BazAR 是基于特征点检测和匹配的计算机视觉库。 它能够快速检测和匹配图像中的已知物体,并且能够用于增强现实,它是计算机视觉研究的先进成果。更多BazAR信息
计算机视觉库 VLFeat
一个开源的计算机视觉库,实现了 SIFT,MSER, k-means, hierarchical k-means, agglomerative information bottleneck, quick shift等算法。由C语言编写,提供MATLAB接口,文档详细。支持跨平台。...更多VLFeat信息
STAIR Vision Library
STAIR Vision Library (SVL) 最初是为支持斯坦福智能机器人设计的,提供对计算机视觉、机器学习和概率统计模型的支持。更多STAIR Vision Library信息
Scilab Image Processing Toolbox
SIP 提供了图像处理、模式识别以及计算机视觉处理。 SIP is able to read/write images in almost 90 major formats, including JPEG, PNG, BMP, GIF, FITS, and TIFF. It includes routines for filtering, segmentation, edge detection, morphology, cu...更多Scilab Image Processing Toolbox信息
3D计算机视觉库 openvis3d
这个项目的目的是提供一个高效的3D计算机视觉库,用于图像和视频处理。它包括深度立体匹配、光流(运动)估计、遮挡检测和运动平台估计更多openvis3d信息
libvideogfx
视频处理、计算机视觉和计算机图形学的快速开发库。更多libvideogfx信息
go-opencv
Go-OpenCV 是 Go 语言版的 OpenCV 封装。更多go-opencv信息
JavaScript图形绘制库 Toxiclibs.js
Toxiclibs.js 是一个开源的计算机图形设计库,无需外部依赖,使用 <canvas> 元素进行图形绘制。更多Toxiclibs.js信息
OpenCL 封装库 CLOGS
CLOGS 是 OpenCL C++ API 的高级封装库,其设计目的是集成其他 OpenCL 代码,包括同步 OpenCL 事件,当前支持两个操作:基数排序和独立扫描。更多CLOGS信息
最近更新: CLOGS 1.2.0 发布,OpenCL 的封装库 发布于 2个月前
openvgr
OpenVGR 包含以下几个实时处理模块 (基于 OpenRTM-1.0): 立体相机采集 (对于 IEEE 1394b 相机), 立体图像浏览器, 3-D 点云重建 (使用 OpenCV), 基于边缘的 3-D 物体检测 包含以下几个命令行工具: 模型建立, 多相机标定....更多openvgr信息
sparse-stereo-vision
使用 OpenCV 函数, 这个项目能从成对的立体图像中重建场景。更多sparse-stereo-vision信息
PIV图形软件包 Fluere
Fluere是粒子图像测速(PIV)的图形软件包。 Fluere是高度优化的并行处理,并在多个平台上运行。该项目的目标是提供高质量的测速软件,采用PIV技术处理的最新进展的研究人员和教育工作者,而所使用的算法的完整的知识。更多Fluere信息
stereoview
stereoview 是一个立体可视化和标定工具更多stereoview信息
- Resources in Visual Tracking 转自 :http://blog.csdn.net/minstyrain/article/details/38640541
这个应该是目前最全的Tracking相关的文章了,转载请注明出处。一、Surveyand benchmark:
1. PAMI2014:VisualTracking_ An Experimental Survey,代码:http://alov300pp.joomlafree.it/trackers-resource.html
2. CVPR2013:Online Object Tracking: A Benchmark(需FQ)
3. SignalProcessing 2011:Video Tracking Theory andPractice
4. ACCV2006:Tutorials-Advances in VisualTracking:中文:视觉跟踪的进展
5. Evaluationof an online learning approach for robust object tracking
二、研究团体:
1. Universityof California at Merced:Ming-HsuanYang视觉跟踪当之无愧第一人,后面的人基本上都和气其有合作关系,他引近9000
PublicationsPAMI:6,CVPR:26,ECCV:17,BMCV:6,NIPS:6,IJCV:3,ACCV:3
代表作:RobustVisual Tracking via Consistent Low-Rank Sparse Learning
FCT,IJCV2014:FastCompressive Tracking
RST,PAMI2014:RobustSuperpixel Tracking; SPT,ICCV2011, Superpixeltracking
SVD,TIP2014:LearningStructured Visual Dictionary for Object Tracking
ECCV2014: SpatiotemporalBackground Subtraction Using Minimum Spanning Tree and Optical Flow
PAMI2011:RobustObject Tracking with Online Multiple Instance Learning
MIT,CVPR2009: Visualtracking with online multiple instance learning
IJCV2008: IncrementalLearning for Robust Visual Tracking
2. SeoulNational University Professor:KyoungMuLee2013年在PAMI上发表5篇,至今无人能及
文献列表PAMI:13,CVPR:30,ECCV:12,ICCV:8,PR:4
PAMI2014:A GeometricParticle Filter for Template-Based Visual Tracking
ECCV2014: Robust Visual Tracking with Double Bounding Box Model
PAMI2013:HighlyNonrigid Object Tracking via Patch-based Dynamic Appearance Modeling
CVPR2014: Interval Tracker: Tracking by Interval Analysis
CVPR2013: MinimumUncertainty Gap for Robust Visual Tracking
CVPR2012:RobustVisual Tracking using Autoregressive Hidden Markov Model
VTS,ICCV2011:Tracking by Sampling Trackers.
VTD,CVPR2010: VisualTracking Decomposition
TST,ICCV2011:Tracking by sampling trackers
3. TempleUniversity,凌海滨
Publication List PMAI:4,CVPR:19,ICCV:17,ECCV:5,TIP:9
CVPR2014:Multi-targetTracking with Motion Context in Tenor Power Iteration
ECCV2014:TransferLearning Based Visual Tracking with Gaussian Process Regression
ICCV2013:Findingthe Best from the Second Bests - Inhibiting Subjective Bias in Evaluation ofVisual Tracking Algorithms
CVPR2013: Multi-targetTracking by Rank-1 Tensor Approximation
CVPR2012:RealTime Robust L1 Tracker Using Accelerated Proximal Gradient Approach
TIP2012: Real-timeProbabilistic Covariance Tracking with Efficient Model Update
ICCV2011: BlurredTarget Tracking by Blur-driven Tracker
PAMI2011ICCV2009: RobustVisual Tracking and Vehicle Classification via Sparse Representation
ICCV2011:RobustVisual Tracking using L1 Minimization
L1O,CVPR2011: Minimumerror bounded efficient l1 tracker with occlusion detection
L1T, ICCV2009:Robustvisual tracking using l1 minimization
4. HongKong Polytechnic University AssociateProfessor: Lei Zhang
PapersPAMI:2,CVPR:18,ICCV:14,ECCV:12,ICPR:6,PR:28,TIP:4
STC,ECCV2014: FastTracking via Dense Spatio-Temporal Context Learning
FCT,PAMI2014,ECCV2012:Fast CompressiveTracking, Minghsuan Yang
IETComputer Vision2012:Scale and Orientation Adaptive Mean Shift Tracking
IJPRAI2009:RobustObject Tracking using Joint Color-Texture Histogram
5. 大连理工大学教授 卢湖川国内追踪领域第一人
CVPR2014:VisualTracking via Probability Continuous Outlier Model
TIP2014:VisualTracking via Discriminative Sparse Similarity Map
TIP2014: RobustSuperpixel Tracking
TIP2014: RobustObject Tracking via Sparse Collaborative Appearance Model
CVPR2013: LeastSoft-threshold Squares Tracking, MinghsuanYang
TIP2013:Online Object Trackingwith Sparse Prototypes, Minghsuan Yang
SignalProcessing Letters2013: Graph-RegularizedSaliency Detection With Convex-Hull-Based Center Prior
SignalProcessing2013: On-line LearningParts-based Representation via Incremental Orthogonal Projective Non-negativeMatrix Factorization
CVPR2012:RobustObject Tracking viaSparsity-based Collaborative Model, MinghsuanYang
CVPR2012:VisualTracking via Adaptive Structural Local Sparse Appearance Model, MinghsuanYang
SignalProcessing Letters 2012:Object tracking via 2DPCA and L1-regularization
IETImage Processing 2012:Visual Tracking via Bag of Features
ICPR2012:Superpixel Level Object Recognition Under Local Learning Framework
ICPR2012: Fragment-BasedTracking Using Online Multiple Kernel Learning
ICPR2012: ObjectTracking Based On Local Learning
ICPR2012: ObjectTracking with L2_RLS
ICPR2011:ComplementaryVisual Tracking
FG2011:OnlineMultiple Support Instance Tracking
SignalProcessing2010: A novel methodfor gaze tracking by local pattern model and support vector regressor
ACCV2010: OnFeature Combination and Multiple Kernel Learning for Object Tracking
ACCV: RobustTracking Based on Pixel-wise Spatial Pyramid and Biased Fusion
ACCV2010: HumanTracking by Multiple Kernel Boosting with Locality Affinity Constraints
ICCV2011:SuperpixelTracking, Minghsuan Yang
ICPR2010: RobustTracking Based on Boosted Color Soft Segmentation and ICA-R
ICPR2010: IncrementalMPCA for Color Object Tracking
ICPR2010: Bagof Features Tracking
ICPR2008: GazeTracking By Binocular Vision and LBP Features
6. 南京信息工程大学教授,KaiHua Zhang
7. OregonstateProfessor,Sinisa Todorovic由视频分割转向Tracking
CSL,CVPR2014: Multi-ObjectTracking via Constrained Sequential Labeling
CVPR2011:MultiobjectTracking as Maximum Weight Independent Set
8. GrazUniversity of Technology, Austria,Horst Possegger博士
CVPR2014:OcclusionGeodesics for Online Multi-Object Tracking
CVPR2013: RobustReal-Time Tracking of Multiple Objects by Volumetric Mass Densities
9. 马里兰大学Zdenek Kalal博士
TLD,PAMI2011: Tracking-Learning-Detection
TIP2010: Face-TLD:Tracking-Learning-Detection Applied to Faces
ICPR2010:Forward-BackwardError: Automatic Detection of Tracking Failures
CVPR2010: P-N Learning:Bootstrapping Binary Classifiers by Structural Constraints
BMVC2008: Weighted Sampling forLarge-Scale Boosting
中文讲解:
TLD视觉跟踪算法
TLD源码深度分析
庖丁解牛TLD
TLD(Tracking-Learning-Detection)学习与源码理解
三、其他早期工作:
Tracking of a Non-Rigid ObjectviaPatch-based Dynamic Appearance Modeling and Adaptive Basin Hopping Monte CarloSampling
tracking-by-detection
粒子滤波演示与opencv代码
opencv学习笔记-入门(6)-camshift
Camshift算法原理及其Opencv实现
Camshift算法
CamShift算法,OpenCV实现1--Back Projection
目标跟踪学习笔记_2(particle filter初探1)
目标跟踪学习笔记_3(particle filter初探2)
目标跟踪学习笔记_4(particle filter初探3)
目标跟踪学习系列一:on-line boosting and vision 阅读
本人新添加的库:
CCV库
ccv是一个基于C语言的、带缓存的现代计算机视觉库。
链接:https://github.com/liuliu/ccv,http://libccv.org/
visionworkbench库
visionworkbench是NASA开发的通用图像处理、计算机视觉算法工具库。代码充分利用C++模板和泛型编程等特性,结构清晰,使用方便。工具库功能也很多,包括了常用数学计算、文件IO、相机模型、几何计算、特征点、Bundle Adjustment。对机器人视觉、三维视觉方面的研发想必很有帮助。
链接:https://github.com/nasa/visionworkbench/
ITK库
ITK(Insight Segmentation and Registration Toolkit) 是一个开源,跨平台的图像分析框架,里面有大量的前沿算法,广泛用于图像配准和分割。ITK使用C++开发,可由CMake生成不同环境下的可编译工程,并且ITK有对Tcl, Python和Java的封装层,使得开发者可以使用不同的语言进行开发。
链接:http://www.itk.org/
VTK库
Vtk,(visualization toolkit)是一个开放资源的免费软件系统,主要用于三维计算机图形学、图像处理和可视化。Vtk是在面向对象原理的基础上设计和实现的,它的内核是用C++构建的,包含有大约250,000行代码,2000多个类,还包含有几个转换界面,因此也可以自由的通过Java,Tcl/Tk和Python各种语言使用vtk。
http://www.vtk.org/
计算机视觉整理库