首页 > 代码库 > 最简单的视音频播放示例8:DirectSound播放PCM

最简单的视音频播放示例8:DirectSound播放PCM

DirectSound简介

DirectSound是微软所开发DirectX的组件之一,可以在Windows 操作系统上录音,并且记录波形音效(waveform sound)。目前DirectSound 是一个成熟的API ,提供许多有用的功能,例如能够在较高的分辨率播放多声道声音。
DirectSound3D(DS3D)最早是1993年与 DirectX 3 一起发表的。DirectX 8以后的DirectSound和DirectSound3D的(DS3D)被合称DirectX Audio。


DirectSound有以下几种对象:

对象

数量

作用

主要接口

设备

每个应用程序只有一个设备对象

用来管理设备,创建辅助缓冲区

IDirectSound8

辅助缓冲区

每一个声音对应一个辅助缓冲区

用来管理一个静态的或者动态的声音流,然后在主缓冲区中混音

IDirectSoundBuffer8,

IDirectSound3DBuffer8,

IDirectSoundNotify8

主缓冲区

一个应用程序只有一个主缓冲区

将辅助缓冲区的数据进行混音,并且控制3D参数.

IDirectSoundBuffer,

IDirectSound3DListener8



DirectSound播放音频的流程

使用DirectSound播放音频一般情况下需要如下步骤:

1. 初始化

1) 创建一个IDirectSound8接口的对象
2) 设置协作级
3) 创建一个主缓冲对象
4) 创建一个副缓冲对象
5) 创建通知对象
6) 设置通知位置

7) 开始播放

2. 循环播放声音

1) 数据填充至副缓冲区

2) 等待播放完成

下面结合详细分析一下上文的流程。


1. 初始化
1) 创建一个IDirectSound8接口的对象

通过DirectSoundCreate8()方法可以创建一个设备对象。这个对象通常代表缺省的播放设备。DirectSoundCreate8()函数定义如下。

[cpp] view plaincopy在CODE上查看代码片派生到我的代码片
  1. HRESULT DirectSoundCreate8(  
  2.      LPCGUID lpcGuidDevice,  
  3.      LPDIRECTSOUND8 * ppDS8,  
  4.      LPUNKNOWN pUnkOuter  
  5. )  


参数的含义如下:
lpcGuidDevice:要创建的设备对象的GUID。可以指定为NULL,代表默认的播放设备。
ppDS8:返回的IDirectSound8对象的地址。
pUnkOuter:必须设为NULL。
例如如下代码即可创建一个IDirectSound8接口的对象

[cpp] view plaincopy在CODE上查看代码片派生到我的代码片
  1. IDirectSound8 *m_pDS=NULL;    
  2. DirectSoundCreate8(NULL,&m_pDS,NULL);  


2) 设置协作级
Windows 是一个多任务环境,同一时间有多个应用程序去访问设备。通过使用协作级别,DirectSound可以确保应用程序不会在别的设备使用时去访问,每个 DirectSound应用程序都有一个协作级别,这个级别决定着访问硬件的权限。
在创建一个设备对象以后,必须通过用IDirectSound8的SetCooperativeLevel()设置协作权限,否则将听不到声音。SetCooperativeLevel()的定义如下

[cpp] view plaincopy在CODE上查看代码片派生到我的代码片
  1. HRESULT SetCooperativeLevel(  
  2.  HWND hwnd,  
  3.  DWORD dwLevel  
  4. )  


参数的含义如下:
hwnd:应用程序窗口句柄。
dwLevel:支持以下几种级别。
DSSCL_EXCLUSIVE:与DSSCL_PRIORITY具有相同的作用。
DSSCL_NORMAL:正常的协调层级标志,其他程序可共享声卡设备进行播放。
DSSCL_PRIORITY:设置声卡设备为当前程序独占。
DSSCL_WRITEPRIMAR:可写主缓冲区,此时副缓冲区就不能进行播放处理,即不能将次缓冲区的数据送进混声器,再输出到主缓冲区上。这是最完全控制声音播放的方式。


3) 创建一个主缓冲对象
使用IDirectSound8的CreateSoundBuffer()可以创建一个IDirectSoundBuffer接口的主缓冲区对象。CreateSoundBuffer()的定义如下。

[cpp] view plaincopy在CODE上查看代码片派生到我的代码片
  1. HRESULT CreateSoundBuffer(  
  2.  LPCDSBUFFERDESC pcDSBufferDesc,  
  3.  LPDIRECTSOUNDBUFFER * ppDSBuffer,  
  4.  LPUNKNOWN pUnkOuter  
  5. )  


参数的含义如下:
pcDSBufferDesc:描述声音缓冲的DSBUFFERDESC结构体的地址
ppDSBuffer:返回的IDirectSoundBuffer接口的对象的地址。
pUnkOuter:必须设置为NULL。
其中涉及到一个描述声音缓冲的结构体DSBUFFERDESC,该结构体的定义如下:

[cpp] view plaincopy在CODE上查看代码片派生到我的代码片
  1. typedef struct _DSBUFFERDESC  
  2. {  
  3.     DWORD           dwSize;  
  4.     DWORD           dwFlags;  
  5.     DWORD           dwBufferBytes;  
  6.     DWORD           dwReserved;  
  7.     LPWAVEFORMATEX  lpwfxFormat;  
  8. } DSBUFFERDESC  


简单解释一下其中的变量的含义:
dwSize:结构体的大小。必须初始化该值。
dwFlags:设置声音缓存的属性。有很多选项,可以组合使用,就不一一列出了。详细的参数可以查看文档。
dwBufferBytes:缓冲的大小。
dwReserved:保留参数,暂时没有用。
lpwfxFormat:指向一个WAVE格式文件头的指针。
设置DSBUFFERDESC完毕后,就可以使用CreateSoundBuffer()创建主缓冲了。示例代码如下:

[cpp] view plaincopy在CODE上查看代码片派生到我的代码片
  1. DSBUFFERDESC dsbd;  
  2. memset(&dsbd,0,sizeof(dsbd));  
  3. dsbd.dwSize=sizeof(dsbd);  
  4. dsbd.dwFlags=DSBCAPS_GLOBALFOCUS | DSBCAPS_CTRLPOSITIONNOTIFY |DSBCAPS_GETCURRENTPOSITION2;  
  5. dsbd.dwBufferBytes=MAX_AUDIO_BUF*BUFFERNOTIFYSIZE;   
  6. //WAVE Header  
  7. dsbd.lpwfxFormat=(WAVEFORMATEX*)malloc(sizeof(WAVEFORMATEX));  
  8. dsbd.lpwfxFormat->wFormatTag=WAVE_FORMAT_PCM;     
  9. /* format type */  
  10. (dsbd.lpwfxFormat)->nChannels=channels;            
  11. /* number of channels (i.e. mono, stereo...) */  
  12. (dsbd.lpwfxFormat)->nSamplesPerSec=sample_rate;       
  13. /* sample rate */  
  14. (dsbd.lpwfxFormat)->nAvgBytesPerSec=sample_rate*(bits_per_sample/8)*channels;   
  15. /* for buffer estimation */  
  16. (dsbd.lpwfxFormat)->nBlockAlign=(bits_per_sample/8)*channels;          
  17. /* block size of data */  
  18. (dsbd.lpwfxFormat)->wBitsPerSample=bits_per_sample;       
  19. /* number of bits per sample of mono data */  
  20. (dsbd.lpwfxFormat)->cbSize=0;  
  21.   
  22.   
  23. //Creates a sound buffer object to manage audio samples.   
  24. HRESULT hr1;  
  25. if( FAILED(m_pDS->CreateSoundBuffer(&dsbd,&m_pDSBuffer,NULL))){     
  26.     return FALSE;  
  27. }  



4) 创建一个副缓冲对象
使用IDirectSoundBuffer的QueryInterface()可以得到一个IDirectSoundBuffer8接口的对象。IDirectSoundBuffer8的GUID为IID_IDirectSoundBuffer8。示例代码如下。

[cpp] view plaincopy在CODE上查看代码片派生到我的代码片
  1. IDirectSoundBuffer *m_pDSBuffer=NULL;  
  2. IDirectSoundBuffer8 *m_pDSBuffer8=NULL;  
  3. ...  
  4. if( FAILED(m_pDSBuffer->QueryInterface(IID_IDirectSoundBuffer8,(LPVOID*)&m_pDSBuffer8))){  
  5.     return FALSE ;  
  6. }  



5) 创建通知对象
使用IDirectSoundBuffer8的QueryInterface()可以得到一个IDirectSoundNotify8接口的对象。IDirectSoundBuffer8的GUID为IID_IDirectSoundNotify。示例代码如下。

[cpp] view plaincopy在CODE上查看代码片派生到我的代码片
  1. IDirectSoundBuffer8 *m_pDSBuffer8=NULL;  
  2. IDirectSoundNotify8 *m_pDSNotify=NULL;    
  3. …  
  4. if(FAILED(m_pDSBuffer8->QueryInterface(IID_IDirectSoundNotify,(LPVOID*)&m_pDSNotify))){  
  5.     return FALSE ;  
  6. }  



一句话概括一下通知对象的作用:当DirectSound缓冲区中的数据播放完毕后,告知系统应该填充新的数据。


6) 设置通知位置
使用IDirectSoundNotify8的SetNotificationPositions()可以设置通知的位置。SetNotificationPositions()的定义如下。

[cpp] view plaincopy在CODE上查看代码片派生到我的代码片
  1. HRESULT SetNotificationPositions(  
  2.          DWORD dwPositionNotifies,  
  3.          LPCDSBPOSITIONNOTIFY pcPositionNotifies  
  4. )  


参数含义如下。
dwPositionNotifies:DSBPOSITIONNOTIFY结构体的数量。既包含几个通知的位置。
pcPositionNotifies:指向DSBPOSITIONNOTIFY结构体数组的指针。
再这里涉及到一个结构体DSBPOSITIONNOTIFY,它描述了通知的位置。DSBPOSITIONNOTIFY的定义如下。

[cpp] view plaincopy在CODE上查看代码片派生到我的代码片
  1. typedef struct DSBPOSITIONNOTIFY {  
  2.     DWORD dwOffset;  
  3.     HANDLE hEventNotify;  
  4. } DSBPOSITIONNOTIFY;  


它的成员的含义如下。
dwOffset:通知事件触发的位置(距离缓冲开始位置的偏移量)。
hEventNotify:触发的事件的句柄。


7) 开始播放
使用IDirectSoundBuffer8的SetCurrentPosition ()可以设置播放的位置。SetCurrentPosition ()定义如下

[cpp] view plaincopy在CODE上查看代码片派生到我的代码片
  1. HRESULT SetCurrentPosition(  
  2.          DWORD dwNewPosition  
  3. )  


其中dwNewPosition是播放点与缓冲区首个字节之间的偏移量。
使用IDirectSoundBuffer8的Play ()可以开始播放音频数据。Play ()定义如下。

[cpp] view plaincopy在CODE上查看代码片派生到我的代码片
  1. HRESULT Play(  
  2.          DWORD dwReserved1,  
  3.          DWORD dwPriority,  
  4.          DWORD dwFlags  
  5. )  


参数含义:
dwReserved1:保留参数,必须取0。
dwPriority:优先级,一般情况下取0即可。
dwFlags:标志位。目前常见的是DSBPLAY_LOOPING。当播放至缓冲区结尾的时候,重新从缓冲区开始处开始播放。


2. 循环播放声音
1) 数据填充至副缓冲区

数据填充至副缓冲区之前,需要先使用Lock()锁定缓冲区。然后就可以使用fread(),memcpy()等方法将PCM音频采样数据填充至缓冲区。数据填充完毕后,使用Unlock()取消对缓冲区的锁定。
Lock()函数的定义如下。

[cpp] view plaincopy在CODE上查看代码片派生到我的代码片
  1. HRESULT Lock(  
  2.          DWORD dwOffset,  
  3.          DWORD dwBytes,  
  4.          LPVOID * ppvAudioPtr1,  
  5.          LPDWORD  pdwAudioBytes1,  
  6.          LPVOID * ppvAudioPtr2,  
  7.          LPDWORD pdwAudioBytes2,  
  8.          DWORD dwFlags  
  9. )  


参数的含义如下。
dwOffset:锁定的内存与缓冲区首地址之间的偏移量。
dwBytes:锁定的缓存的大小。
ppvAudioPtr1:获取到的指向缓存数据的指针。
pdwAudioBytes1:获取到的缓存数据的大小。
ppvAudioPtr2:没有用到,设置为NULL。
pdwAudioBytes2:没有用到,设置为0。
dwFlags:暂时没有研究。


UnLock()函数的定义如下。

[cpp] view plaincopy在CODE上查看代码片派生到我的代码片
  1. HRESULT Unlock(  
  2.          LPVOID pvAudioPtr1,  
  3.          DWORD dwAudioBytes1,  
  4.          LPVOID pvAudioPtr2,  
  5.          DWORD dwAudioBytes2  
  6. )  


参数含义如下。
pvAudioPtr1:通过Lock()获取到的指向缓存数据的指针。
dwAudioBytes1:写入的数据量。
pvAudioPtr2:没有用到。

dwAudioBytes2:没有用到。

2) 等待播放完成

根据此前设置的通知机制,使用WaitForMultipleObjects()等待缓冲区中的数据播放完毕,然后进入下一个循环。


播放音频流程总结

DirectSound播放PCM音频数据的流程如下图所示。

 



其中涉及到的几个结构体之间的关系如下图所示。
 




代码

贴上源代码。

[cpp] view plaincopy在CODE上查看代码片派生到我的代码片
  1. /** 
  2.  * 最简单的DirectSound播放音频的例子(DirectSound播放PCM) 
  3.  * Simplest Audio Play DirectSound (DirectSound play PCM)  
  4.  * 
  5.  * 雷霄骅 Lei Xiaohua 
  6.  * leixiaohua1020@126.com 
  7.  * 中国传媒大学/数字电视技术 
  8.  * Communication University of China / Digital TV Technology 
  9.  * http://blog.csdn.net/leixiaohua1020 
  10.  * 
  11.  * 本程序使用DirectSound播放PCM音频采样数据。 
  12.  * 是最简单的DirectSound播放音频的教程。 
  13.  * 
  14.  * 函数调用步骤如下:  
  15.  * 
  16.  * [初始化] 
  17.  * DirectSoundCreate8(): 创建一个DirectSound对象。 
  18.  * SetCooperativeLevel(): 设置协作权限,不然没有声音。 
  19.  * IDirectSound8->CreateSoundBuffer(): 创建一个主缓冲区对象。 
  20.  * IDirectSoundBuffer->QueryInterface(IID_IDirectSoundBuffer8..):  
  21.  *          创建一个副缓冲区对象,用来存储要播放的声音数据文件。 
  22.  * IDirectSoundBuffer8->QueryInterface(IID_IDirectSoundNotify..):  
  23.  *          创建通知对象,通知应用程序指定播放位置已经达到。 
  24.  * IDirectSoundNotify8->SetNotificationPositions(): 设置通知位置。 
  25.  * IDirectSoundBuffer8->SetCurrentPosition(): 设置播放的起始点。 
  26.  * IDirectSoundBuffer8->Play(): 开始播放。 
  27.  * 
  28.  * [循环播放数据] 
  29.  * IDirectSoundBuffer8->Lock(): 锁定副缓冲区,准备写入数据。 
  30.  * fread(): 读取数据。 
  31.  * IDirectSoundBuffer8->Unlock(): 解锁副缓冲区。 
  32.  * WaitForMultipleObjects(): 等待“播放位置已经达到”的通知。 
  33.  * 
  34.  * This software plays PCM raw audio data using DirectSound. 
  35.  * It‘s the simplest tutorial about DirectSound. 
  36.  * 
  37.  * The process is shown as follows: 
  38.  * 
  39.  * [Init] 
  40.  * DirectSoundCreate8(): Init DirectSound object. 
  41.  * SetCooperativeLevel(): Must set, or we won‘t hear sound. 
  42.  * IDirectSound8->CreateSoundBuffer(): Create primary sound buffer. 
  43.  * IDirectSoundBuffer->QueryInterface(IID_IDirectSoundBuffer8..):  
  44.  *          Create secondary sound buffer. 
  45.  * IDirectSoundBuffer8->QueryInterface(IID_IDirectSoundNotify..):  
  46.  *          Create Notification object. 
  47.  * IDirectSoundNotify8->SetNotificationPositions(): 
  48.  *          Set Notification Positions. 
  49.  * IDirectSoundBuffer8->SetCurrentPosition(): Set position to start. 
  50.  * IDirectSoundBuffer8->Play(): Begin to play. 
  51.  * 
  52.  * [Loop to play data] 
  53.  * IDirectSoundBuffer8->Lock(): Lock secondary buffer. 
  54.  * fread(): get PCM data. 
  55.  * IDirectSoundBuffer8->Unlock(): UnLock secondary buffer. 
  56.  * WaitForMultipleObjects(): Wait for Notifications. 
  57.  */  
  58. #include <stdio.h>  
  59. #include <stdlib.h>  
  60. #include <windows.h>  
  61. #include <dsound.h>  
  62.   
  63.   
  64. #define MAX_AUDIO_BUF 4   
  65. #define BUFFERNOTIFYSIZE 192000   
  66.   
  67.   
  68. int sample_rate=44100;  //PCM sample rate  
  69. int channels=2;         //PCM channel number  
  70. int bits_per_sample=16; //bits per sample  
  71.   
  72. BOOL main(int argc,char * argv[])  
  73. {  
  74.     int i;  
  75.     FILE * fp;  
  76.     if((fp=fopen("../NocturneNo2inEflat_44.1k_s16le.pcm","rb"))==NULL){  
  77.         printf("cannot open this file\n");  
  78.         return -1;  
  79.     }  
  80.   
  81.     IDirectSound8 *m_pDS=NULL;                    
  82.     IDirectSoundBuffer8 *m_pDSBuffer8=NULL; //used to manage sound buffers.  
  83.     IDirectSoundBuffer *m_pDSBuffer=NULL;     
  84.     IDirectSoundNotify8 *m_pDSNotify=NULL;        
  85.     DSBPOSITIONNOTIFY m_pDSPosNotify[MAX_AUDIO_BUF];  
  86.     HANDLE m_event[MAX_AUDIO_BUF];  
  87.   
  88.     SetConsoleTitle(TEXT("Simplest Audio Play DirectSound"));//Console Title  
  89.     //Init DirectSound  
  90.     if(FAILED(DirectSoundCreate8(NULL,&m_pDS,NULL)))  
  91.         return FALSE;  
  92.     if(FAILED(m_pDS->SetCooperativeLevel(FindWindow(NULL,TEXT("Simplest Audio Play DirectSound")),DSSCL_NORMAL)))  
  93.         return FALSE;  
  94.   
  95.   
  96.     DSBUFFERDESC dsbd;  
  97.     memset(&dsbd,0,sizeof(dsbd));  
  98.     dsbd.dwSize=sizeof(dsbd);  
  99.     dsbd.dwFlags=DSBCAPS_GLOBALFOCUS | DSBCAPS_CTRLPOSITIONNOTIFY |DSBCAPS_GETCURRENTPOSITION2;  
  100.     dsbd.dwBufferBytes=MAX_AUDIO_BUF*BUFFERNOTIFYSIZE;   
  101.     //WAVE Header  
  102.     dsbd.lpwfxFormat=(WAVEFORMATEX*)malloc(sizeof(WAVEFORMATEX));  
  103.     dsbd.lpwfxFormat->wFormatTag=WAVE_FORMAT_PCM;     
  104.     /* format type */  
  105.     (dsbd.lpwfxFormat)->nChannels=channels;            
  106.     /* number of channels (i.e. mono, stereo...) */  
  107.     (dsbd.lpwfxFormat)->nSamplesPerSec=sample_rate;       
  108.     /* sample rate */  
  109.     (dsbd.lpwfxFormat)->nAvgBytesPerSec=sample_rate*(bits_per_sample/8)*channels;   
  110.     /* for buffer estimation */  
  111.     (dsbd.lpwfxFormat)->nBlockAlign=(bits_per_sample/8)*channels;          
  112.     /* block size of data */  
  113.     (dsbd.lpwfxFormat)->wBitsPerSample=bits_per_sample;       
  114.     /* number of bits per sample of mono data */  
  115.     (dsbd.lpwfxFormat)->cbSize=0;  
  116.   
  117.     //Creates a sound buffer object to manage audio samples.   
  118.     HRESULT hr1;  
  119.     if( FAILED(m_pDS->CreateSoundBuffer(&dsbd,&m_pDSBuffer,NULL))){     
  120.         return FALSE;  
  121.     }  
  122.     if( FAILED(m_pDSBuffer->QueryInterface(IID_IDirectSoundBuffer8,(LPVOID*)&m_pDSBuffer8))){  
  123.         return FALSE ;  
  124.     }  
  125.     //Get IDirectSoundNotify8  
  126.     if(FAILED(m_pDSBuffer8->QueryInterface(IID_IDirectSoundNotify,(LPVOID*)&m_pDSNotify))){  
  127.         return FALSE ;  
  128.     }  
  129.     for(i =0;i<MAX_AUDIO_BUF;i++){  
  130.         m_pDSPosNotify[i].dwOffset =i*BUFFERNOTIFYSIZE;  
  131.         m_event[i]=::CreateEvent(NULL,false,false,NULL);   
  132.         m_pDSPosNotify[i].hEventNotify=m_event[i];  
  133.     }  
  134.     m_pDSNotify->SetNotificationPositions(MAX_AUDIO_BUF,m_pDSPosNotify);  
  135.     m_pDSNotify->Release();  
  136.   
  137.     //Start Playing  
  138.     BOOL isPlaying =TRUE;  
  139.     LPVOID buf=NULL;  
  140.     DWORD  buf_len=0;  
  141.     DWORD res=WAIT_OBJECT_0;  
  142.     DWORD offset=BUFFERNOTIFYSIZE;  
  143.   
  144.     m_pDSBuffer8->SetCurrentPosition(0);  
  145.     m_pDSBuffer8->Play(0,0,DSBPLAY_LOOPING);  
  146.     //Loop  
  147.     while(isPlaying){  
  148.         if((res >=WAIT_OBJECT_0)&&(res <=WAIT_OBJECT_0+3)){  
  149.             m_pDSBuffer8->Lock(offset,BUFFERNOTIFYSIZE,&buf,&buf_len,NULL,NULL,0);  
  150.             if(fread(buf,1,buf_len,fp)!=buf_len){  
  151.                 //File End  
  152.                 //Loop:  
  153.                 fseek(fp, 0, SEEK_SET);  
  154.                 fread(buf,1,buf_len,fp);  
  155.                 //Close:  
  156.                 //isPlaying=0;  
  157.             }  
  158.             m_pDSBuffer8->Unlock(buf,buf_len,NULL,0);  
  159.             offset+=buf_len;  
  160.             offset %= (BUFFERNOTIFYSIZE * MAX_AUDIO_BUF);  
  161.             printf("this is %7d of buffer\n",offset);  
  162.         }  
  163.         res = WaitForMultipleObjects (MAX_AUDIO_BUF, m_event, FALSE, INFINITE);  
  164.     }  
  165.   
  166.     return 0;  
  167. }  



运行结果

代码运行之后,会弹出一个“控制台”对话框如下图所示。同时音频设备里面可以听到播放的声音。

 


 

下载

代码位于“Simplest Media Play”中


SourceForge项目地址:https://sourceforge.net/projects/simplestmediaplay/

 

 

上述工程包含了使用各种API(Direct3D,OpenGL,GDI,DirectSound,SDL2)播放多媒体例子。其中音频输入为PCM采样数据。输出至系统的声卡播放出来。视频输入为YUV/RGB像素数据。输出至显示器上的一个窗口播放出来。
通过本工程的代码初学者可以快速学习使用这几个API播放视频和音频的技术。
一共包括了如下几个子工程:
simplest_audio_play_directsound: 使用DirectSound播放PCM音频采样数据。
simplest_audio_play_sdl2: 使用SDL2播放PCM音频采样数据。
simplest_video_play_direct3d: 使用Direct3D的Surface播放RGB/YUV视频像素数据。
simplest_video_play_direct3d_texture:使用Direct3D的Texture播放RGB视频像素数据。
simplest_video_play_gdi: 使用GDI播放RGB/YUV视频像素数据。
simplest_video_play_opengl: 使用OpenGL播放RGB/YUV视频像素数据。
simplest_video_play_opengl_texture: 使用OpenGL的Texture播放YUV视频像素数据。
simplest_video_play_sdl2: 使用SDL2播放RGB/YUV视频像素数据。

最简单的视音频播放示例8:DirectSound播放PCM