学海荡舟手机网

主页 > 实用文摘 > 教育文摘_07 > > 详细内容

Linux系统下USB摄像头驱动开发_接口电路论文

摘要:介绍了在iinux系统下开发符合video for linux标准的usb摄像头驱动的方法,并对该标准提出“不间断采集”的改进思路,配合双urb、双帧缓冲等方法,提高采集速度。

    关键词:linux设备驱动 usb摄像头 video for linux 不间断采集

usb摄像头以其良好的性能和低廉的价格得到广泛应用。同时因其灵活、方便的特性,易于集成到嵌入式系统中。但是如果使用现有的符合video for linux标准的驱动程序配合通用应用程序,难以充分利用usb带宽,帧速不高,不易满足实时监控等要求。本文首先介绍在linux系统下usb摄像头驱动编制的一般方法,然后说明在此基础上如何提高帧速。

1 linux系统中的usb摄像头驱动程序

usb设备驱动程序完全符合通用设备驱动的准则,不同的是内核提供了一些特别的api函数,方便驱动注册、销毁自己,例如usb_resister()和usb_deresister();2.4版的内核还提供了对于hotplug的支持。

1.1 usb摄像头驱动的一般编写方法

摄像头属于视频类设备。在目前的linux核心中,视频部分的标准是video for linux(简称v4l)。这个标准其实定义了一套接口,内核、驱动、应用程序以这个接口为标准进行交流。目前的v4l涵盖了视、音频流捕捉及处理等内容,usb摄像头也属于它支持的范畴。

因此,usb摄像头的驱动应当与内核提供的视频驱动挂钩。即首先在驱动中声明一个video_device结构,并为其指定文件操作函数指针数组.fops,向系统注册。在应用程序发出文件操作的相关命令时,核心根据这些指针调用相应函数,并将该结构作为参数传递给它们。这样,就完成了驱动和核心之间的通信。例如:

static struct video_device vdev_template={……};

//声明video_device,指出挂接驱动

static struct file_operations ov511_fops={……};

//声明本驱动的文件操作函数指针

struct video_device*vdev=video_devdata(file);

//从文件指针中提取出video_device结构

在video_device结构中,有一个私有指针priv,可以将它指向一块保留内存。在这块内存中,保存着本驱动、本设备的相关初始化信息。这块内存的申请、初始化、指针指向等工作都是在usb驱动的枚举函数.probe中完成。这样,在枚举函数将控制权返还给系统后,因为内核不销毁保留内存,所以驱动仍然保留着自己的。这点与windows系统中wdm驱动有异曲同工之处。当然,在驱动卸载函数中,应当将申请的各块内存全部释放。

1.2 使用双urb轮流通信

众所周知,usbl.1总线标准定义了控制、中断、批量、等时等四种管道。对于时间性极强但是准确度要求不高的视频捕捉应用来说,摄像头应当使用等时传输方式。为了尽可能快地得到图像数据,应当在urb中指定usb_iso_asap标志。

urb->transfer_flags=usb_iso_asap;//尽可能快地发出本urb

linux系统中任何usb传输都通过urb实现。为提高速度,可以考虑扩大urb的缓冲,这样可以降低每个usb事务中握手所占比例,提高有效数据的传输速度。但是受限于总线带宽和具体的usb设备芯片,单纯扩大urb的缓冲不能无限制地解决问题。具体分析一下usb传输在操作系统中的实现:每次传输都要包括urb的建立、发出、回收、数据整理等阶段,这些时间不产生有效数据。因此可以建立两个urb,在等待一个urb被回收时,也就是图像正在被传感器采集时,处理、初始化另一个urb,并在回收后立刻将其发出。两个urb交替使用,大大减少了额外时间。工作流程如图1所示。

这个过程是在urb的完成例程中实现的,有两点需要注意:首先处理再次初始化的代码时间不能长,否则会造成完成例程的重人,如果确实来不及,可以在完成例程中设定标志,例如“数据采集好”旗语,由应用程序使用阻塞ioctl()来查询该旗语并做处理;其次由于cpu可能会在完成例程中停留较长时间,系统负担较大,可以在.open函数中初始化两个urb并将其发出,有限度地减轻系统负担。

1.3 使用双帧缓冲提高效率

linux系统中,文件操作通常是由read、write等系统调用来完成。这些系统调用在驱动中的解决方法就是用copy_to_user()、copy_from_user()等函数在核态、户态内存空间中互相拷贝。但是对于大批量的图像数据,采用拷贝的方法显然会增加时间开销,因此用内存映射的方法解决。首先使用vmalloc()申请足够大的核态内存,将其作为图像数据缓冲空间,两个urb带回的图像数据在这里暂存;然后使用remap_page_range()函数将其逐页映射到用户空间中。户态的图像处理程序使用mmap()函数,直接读写核态图像缓冲内存,大大减少额外开销。

图2

    图像数据的处理可能要花费比较长的时间,不同的算法对于数据保留时间的要求也不一样。因此可以申请两帧图像缓冲,在处理一帧图像的同时,将两个urb带回的数据全部填充到另一帧缓冲中,这样可以免去时间冲突上的麻烦。

值得注意的是:这种方法要求时刻持有当前帧的序号、每一帧的起始地址等信息,不能将两帧图像混淆。这些可以保存在保留内存中,当前帧的数据整理、序号改变在urb完成例程中实现。

2 v4l标准的改进

v4l标准目前已经发展到第二版v4l2,其基本思路与v4l相同。

2.1 标准分析

根据v4l标准,户态程序在需要一帧图像时,cpu的走向如图2。cpu按照123456的顺序完成一个循环。在这里,有一个细节被忽略:在完成例程中,也就是图2中步骤6,该urb被立刻发出,但是由于这时用户程序正在阻塞等待,没办法再次提出获得图像的申请,因此在判断有无新请求时,判断的结果必然是当前无请求,导致下一个urb带回的数据被驱动丢弃;由于核态、户态的切换需要一定的时间,加上户态多进程同步等开销,等到应用程序能够再次发出获得一副图像的申请时,已经有不止一个urb带回的数据被丢弃掉,这些urb包含的数据正好是新一帧图像的开始部分。因此驱动必须等到再下一帧图像才能保存数据、缓冲。这样凭白损失了一帧图像,帧速最少下降一半。

2.2 改进思路:不间断采集

为了解决这个问题,可以改进v4l标准作,使其增加新的功能:通过新的参数,让ioetl()函数通知驱动不间断采集、缓冲图像数据,轮流保存在两帧缓冲区中,并在一帧图像采集好后,设定“图像采集好”旗语。户态程序只需要发出一次“获得图像”请求,就可以通过阻塞等待该旗语,不断获得图像。在采集结束后,再次通过新的参数,让驱动停止缓冲即可。cpu工作流程图如图3。

图3

    注意到图2、图3,两种“判断有无新请求”的不同,即可发现新方法假定一直有请求,因此不丢弃每个urb带回的数据,轮流保存在两个帧缓冲内。

v4l已经作为约定俗成的标准被内核支持,因此如果使用全新的参数,工作量将相当巨大,并且不能和现有的应用程序兼容。考虑到现有的图像采集应用程序使用vidiocmcapture作为参数,并提供帧序号,要求驱动将图像保存到指定序号的帧缓冲内。由于驱动通常仅仅提供几帧缓冲,因此该序号不会大于某个数字,如10。因此可以继续使用vidiocmcapture参数,搭配较大的序号来表示新增的功能,例如用10000和10001来分别表示开始和停止缓冲图像数据的要求。驱动在收到vidiocmcapture要求后,检查这个序号。如果小于10000,则按照正常的方法处理,否则按照改进方法。这种思路可以有效解决兼容性问题。

2.3 实验结果

在赛扬366、usbl.1接口的计算机平台上,采用上述不间断采集改进v4l标准,配合双urb、双帧缓冲等方法后,帧速提高两倍有余,有效数据传输速度达960kb/s,接近等时传输方式下usb总线的带宽极限。