首页 > 代码库 > 第十一届机械设计大赛省赛总结

第十一届机械设计大赛省赛总结

收入囊中

  • 用imread读取图片
  • 用nameWindow和imshow展示图片
  • cvtColor彩色图像灰度化
  • imwrite写图像
  • Luv色彩空间转换

初识API
图像读取接口
image = imread(argv[1], CV_LOAD_IMAGE_COLOR);
  • CV_LOAD_IMAGE_UNCHANGED (<0) 图片怎么样就怎么读取(包括透明度这个通道)
  • CV_LOAD_IMAGE_GRAYSCALE ( 0) 
  • CV_LOAD_IMAGE_COLOR (>0) RGB读取

建立窗口
    namedWindow( "Display window", WINDOW_AUTOSIZE );
如果你不是在 Qt这种平台上面,WINDOW_AUTOSIZE足够,会保持图片原有得尺寸

展示窗口
  imshow( "Display window", image ); //注意这里的名字要和nameWindow建立的窗口名字一样

完整程序
#include <opencv2/core/core.hpp>
#include <opencv2/highgui/highgui.hpp>
#include <iostream>

using namespace cv;
using namespace std;

int main( int argc, char** argv )
{
    if( argc != 2)
    {
     cout <<" Usage: display_image ImageToLoadAndDisplay" << endl;
     return -1;
    }

    Mat image;
    image = imread(argv[1], CV_LOAD_IMAGE_COLOR); 

    if(! image.data )
    {
        cout <<  "Could not open or find the image" << std::endl ;
        return -1;
    }

    namedWindow( "Display window", WINDOW_AUTOSIZE );
    imshow( "Display window", image );

    waitKey(0);   //等待键盘时间
    return 0;
}


改变色彩空间,这是一个极其复杂的函数,要完全掌握需要很多知识,总之你要知道RGB只是一种表示方式,在实际处理中还有其他更好的色彩空间(如LUV,L表示物体亮度,u和v是色度
cvtColor( image, gray_image, CV_BGR2GRAY );
函数接口    C++: void cvtColor(InputArray src, OutputArray dst, int code, int dstCn=0 )
最后一个是通道数,如果为0则继承自src的通道,CV_BGR2GRAY是常用的一个参数,将RGB图像转换成灰度图

写图片
imwrite( "./Gray_Image.jpg", gray_image );

#include <cv.h>
#include <highgui.h>

using namespace cv;

int main( int argc, char** argv )
{
 char* imageName = argv[1];

 Mat image;
 image = imread( imageName, 1 );

 if( argc != 2 || !image.data )
 {
   printf( " No image data \n " );
   return -1;
 }

 Mat gray_image;
 cvtColor( image, gray_image, CV_BGR2GRAY );

 imwrite( "./Gray_Image.jpg", gray_image );

 namedWindow( imageName, CV_WINDOW_AUTOSIZE );
 namedWindow( "Gray image", CV_WINDOW_AUTOSIZE );

 imshow( imageName, image );
 imshow( "Gray image", gray_image );

 waitKey(0);

 return 0;
}


举一反三:
  1. 虽然我们都说RGB,但实际存储是BGR,第一个byte是blue
  2. CV_32F is float - the pixel can have any value between 0-1.0, this is useful for some sets of calculations on data - but it has to be converted into 8bits to save or display by multiplying each pixel by 255(from stackoverflow).就是说CV_32F是0.0-1.0的,当我们要储存时候,必须乘255转换成整数,当一个unsigned char 3通道的图片要转换成Luv空间的时候,我们也要先除255再进行转化.
  3. img *= 1./255;
    cvtColor(img, img, CV_BGR2Luv);

你可能会思考OpenCV的imread是怎么做的,我们知道,计算机存储的是二进制,任何文件都是。

主要知道文件的组织格式,任何文件都能读取,比如,我要读取wav格式文件,如下代码。

#include<iostream>
#include<fstream>
#include<cstdio>
#include<stdlib.h>
#include<vector>
#include<cmath>

using namespace std;

/************* Wav file Struct ***************************
 *	占用空间	数据类型	含义
 *	4bytes		char		RIFF,资源交换文件标识		
 *	4bytes		int			从下一个地址开始到文件尾的总字节数
 *	4bytes		char		WAVE,代表wave格式
 *	4bytes		char		FMT,波形格式标识
 *	4bytes		int			sizeof(PCMWAVEFORMAT),量化结果大小
 *	2bytes		short		为1表示线性PCM编码,否则表示有压缩的编码
 *	2bytes		short		1为单身道,2为双声道
 *	4bytes		int			采样频率
 *	4bytes		int			比特率,比特率=采样频率*音频通道数*每次采样得到的样本位数/8
 *	2bytes		short		块对齐
 *	2bytes		short		样本数据位数
 *	4bytes		char		"data",一个标识
 *	4bytes		int			wav文件实际音频数据所占的大小
 ***********************************************************/
typedef struct _WavHeader
{
	char wav_RIFF[4];
	int wav_FileSize;
	char wav_WAVE[4];
	char wav_FMT[4];
	int wav_PCM;
	short wav_PCMCode;
	short wav_Channel;
	int wav_SampleRate;
	int wav_AvgBytePerSecond;
	short wav_BlockAlign;
	short wav_BitsPerSample;
	char  wav_DATA[4];
	int wav_AudioSize;
} wavHeader;

const float a = 0.95;			//预强调系数
const int FrameLen = 256;		//帧长
const int FrameShift = 100;		//帧移
const double PI = 3.1415926;
vector<short>buffer;			//用于存储所有的signal
float Hamming[FrameLen];		//汉明窗

void InitHamming();				//用于汉明窗的初始化
void HammingWindow(vector<short>&, int, float*);		//对数据加窗

int main(int argc, char **argv)
{
	wavHeader waveheader;
	FILE* wavefile = fopen(argv[1], "rb");
	fread(&waveheader, sizeof(struct _WavHeader), 1, wavefile);
	printf("---------------------------wav file info----------------------------\n资源交换文件标识: %s\n文件大小: %d\nWAVE格式标识: %s\n波形格式标识: %s\n量化结果位数: %d\nPCM编码: %d\n单双通道: %d\n采样频率: %d\n比特率: %d\n块对齐: %d\n样本数据位数: %d\nDATA标识: %s\n音频数据大小: %d\n",waveheader.wav_RIFF, waveheader.wav_FileSize, waveheader.wav_WAVE, waveheader.wav_FMT,waveheader.wav_PCM, waveheader.wav_PCMCode, waveheader.wav_Channel, waveheader.wav_SampleRate, waveheader.wav_AvgBytePerSecond,waveheader.wav_BlockAlign, waveheader.wav_BitsPerSample, waveheader.wav_DATA, waveheader.wav_AudioSize);	
			
	return 0;
}


下面是我的输出,所以,读取文件就是这样工作的


---------------------------wav file info----------------------------

资源交换文件标识: RIFF$+

文件大小: 338724

WAVE格式标识: WAVEfmt 

波形格式标识: fmt 

量化结果位数: 16

PCM编码: 1

单双通道: 1

采样频率: 22050

比特率: 88200

块对齐: 4

样本数据位数: 32

DATA标识: data

音频数据大小: 338688



计算机视觉讨论群162501053

转载请注明:http://blog.csdn.net/abcd1992719g





第十一届机械设计大赛省赛总结