首页 > 代码库 > PHP之文件目录基础操作
PHP之文件目录基础操作
我们知道,临时声明的变量是保存在内存中的,即便是静态变量,在脚本运行完毕后也会被释放掉,so,想长久保存一个变量的内容,方法之一就是写到文件中,放到硬盘或服务器上,为此文件操作就必须很熟悉。
1.文件的属性信息获取
首先文件具有类型,在Linux下边,有block(块设备,如磁盘分区、CD-ROM)、char(以字符为输入的设备,如键盘、打印机)、dir(目录类型,目录也是文件的一种)、fifo(命名管道,解释是将信息从一个进程传到另一个进程)、file(普通的文件)、link(链接,类似win下边的快捷方式)、unknow(未知类型)7大类,在win下边,只有3类:file、dir和unknown。Linux渣表示一定要好好搞一下Linux-_-,人家完全是为Linux而生。
关于类型的获取有这么几个函数:filetype:获取类型; is_file:判断为是否是正常文件; is_link:判断是否是链接。
关于属性的获取有这么几个函数:
file_exists:判断文件或目录是否存在;
filesize:获取文件大小;
is_readable、is_writable、is_executable :是否可读、可写、可执行;
filectime、filemtime、fileatime:获取文件的创建时间(create)、修改时间(modify)、访问时间(access),均返回时间戳;
stat:获取文件的一些基本信息,返回一个索引与关联混合数组。
比如,可以这样判断文件类型:
<?php function getFileType($path){ // 获取文件类型 switch(filetype($path)){ case ‘file‘: return ‘ordinary file‘; case ‘dir‘: return ‘directory‘; case ‘block‘: return ‘block device file‘; case ‘char‘: return ‘transfer device base on char‘; case ‘fifo‘: return ‘named pipes‘; case ‘link‘: return ‘symbol link‘; default: return ‘unknown type‘; } }
filesize返回的是以字节为单位的数据,如果是大文件数字或很大,可以对数字先处理一下,代码如下
<?php // 处理文件大小 function getSize($path = ‘‘, $size = -1){ if($path !== null && $size == -1){ // 只传路径就计算大小,也可以使之只处理数字 $size = filesize($path); } if($size >= pow(2, 40)){ return round($size/pow(2, 40), 2).‘TB‘; } else if($size >= pow(2, 30)){ return round($size/pow(2, 30), 2).‘GB‘; } else if($size >= pow(2, 20)){ return round($size/pow(2, 20), 2).‘MB‘; } else if($size >= pow(2, 10)){ return round($size/pow(2, 10), 2).‘KB‘; } else{ return round($size, 2).‘Byte‘; } }
现在综合来获取一下文件信息,代码如下:
<?php function getFileInfo($path){ if(!file_exists($path)){ // 判断文件是否存在 echo ‘file not exists!<br>‘; return; } if(is_file($path)){ // 是文件,打印基础文件名 echo basename($path).‘ is a file<br>‘; } if(is_dir($path)){ // 是目录 ,返回目录 echo dirname($path).‘ is a directory<br>‘; } echo ‘file type:‘.getFileType($path).‘<br>‘; // 获取文件类型 echo ‘file size:‘.getSize($path).‘<br>‘; // 获取文件大小 if(is_readable($path)){ // 是否可读 echo basename($path).‘ is readable<br>‘; } if(is_writeable($path)){ // 是否可写 echo basename($path).‘ is writeable<br>‘; } if(is_executable($path)){ // 是否可执行 echo basename($path).‘ is executable<br>‘; } // touch函数可以修改这些时间 echo ‘file create time: ‘.date(‘Y-m-d H:i:s‘, filectime($path)).‘<br>‘; // 创建时间 echo ‘file modify time: ‘.date(‘Y-m-d H:i:s‘, filemtime($path)).‘<br>‘; // 修改时间 echo ‘last access time: ‘.date(‘Y-m-d H:i:s‘, fileatime($path)).‘<br>‘; // 上次访问时间 echo ‘file owner: ‘.fileowner($path).‘<br>‘; // 文件拥有者 echo ‘file permission: ‘.substr(sprintf(‘%o‘, (fileperms($path))), -4).‘<br>‘; // 文件权限,八进制输出 echo ‘file group: ‘.filegroup($path).‘<br>‘; // 文件所在的组 }
效果如下:
代码中还用到了文件权限、所在组等函数,有必要解释下(说的不对请修正)。一个文件的权限分为可读可写可执行,一般这样表示:rwx,字母对应的表示可读可写可执行,从前往后规定值为4、2、1,三个值相加的结果最大为7,因此0666用的是八进制表示,这样看起来就很方便。为7则表示这个文件具备这三个权限,那为什么打印的是0666呢?我们都知道,进入windows下面是有一个用户的,在Linux下边,与windows类似,也是有一个用户登录进去,因此一个文件可能为该用户所有,一个用户它还有自己所在的组,以及该系统中还有其他组(猜想这样分应该是管理上的需要),因此对于0666,对于第一个6,表示该用户对该文件的权限,第二个6表示该用户所在的组对该文件的权限,第三个6表示其他的组所具有的权限(这样就不用一一去区分除本组外其他的用户了),6就知道该文件是可读可写的(win下可执行都知道是.exe文件)。
2.目录操作
目录的读取,opendir:打开一个目录,返回一个句柄,指向该目录中的内容,如果把目录中的内容看成一个有顺序的数据,比如按顺序的排列的数组,这个句柄就指向这个数组的开头,事实上,系统会把该目录中的内容按照字典排序,无论是文件还是子目录。readdir:读取下一个目录内容,返回文件名,并自动指向该目录中的下一个文件/目录,所以读取一个目录中的内容,不包括子目录中的内容,需要一个循环来控制,在读取完后,还要关闭句柄变量,C语言读取文件时也是这样,打开就有关闭。以我的机子举例:
<?php // 目录的读取 $dir = ‘F:/‘; echo ‘details in ‘.$dir.‘<br>‘; if(is_dir($dir)){ if(($handle = opendir($dir)) == false){ // 获取目录句柄 echo ‘open dir failed‘; return; } while(($name = readdir($handle)) != false){ // 循环读取该目录下内容 $filepath = $dir.‘/‘.$name; echo ‘name: ‘.$name.‘ type: ‘.filetype($filepath).‘<br>‘; } closedir($handle); // 关闭目录句柄 } else{ echo $dir.‘ is not a directory<r>‘; }
效果如下:
可以看到实际上,系统给目录中内容进行了忽略大小写的字典排序。
目录的大小计算,我们知道文件的大小可以由filesize取得,但是php中没有专门计算目录大小的函数。当然php中有计算硬盘大小的函数disk_total_space(计算硬盘总空间)、disk_free_space(计算硬盘可用空间),但是我试了下disk_free_space,貌似计算得不对。正因为有filesize计算文件的大小,因此,需要用到递归,当是目录时,进去继续计算子目录的大小,如果是文件,获取到文件大小并加上返回,代码如下:
<?php // 目录大小计算 function getDirSize($dirpath){ $size = 0; if(false != ($handle = opendir($dirpath))){ while(false != ($file = readdir($handle))){ if($file == ‘.‘ || $file == ‘..‘) //注意过滤目录中自带的点和点点 continue; $filepath = $dirpath.‘/‘.$file; // 前面要接上路径 if(is_file($filepath)){ // 是文件计算大小 $size += filesize($filepath); } else if(is_dir($filepath)){ // 是目录继续计算该目录下的文件 $size += getDirSize($filepath); } else{ $size += 0; } } closedir($handle); } return $size; } $dirsize = ‘F:/size‘; $size = getDirSize($dirsize); echo ‘dir size: ‘.getSize(null, $size).‘<br><br>‘; // 调用前面的数据处理函数
我在F盘建了个size文件,随便弄了点子目录和文档,效果如下,左边是程序求得,右边是右键查看文件夹属性得到的,用以对比。
目录的新建和删除,主要用到,mkdir:新建一个目录,rmdir:删除一个非空目录,注意只能是非空,代码如下:
<?php // 目录的新建和删除 $newDirPath = ‘F:/newDir‘; if(true == @mkdir($newDirPath, 0777, true)){ // 加@是因为文件已存在时php本身可能会抛出一个warning echo ‘create directory ‘.$newDirPath.‘ successfully<br>‘; } else{ if(file_exists($newDirPath)) echo ‘directory ‘.$newDirPath.‘ has existed<br>‘; else echo ‘create directory ‘.$newDirPath.‘ failed<br>‘; } if(true == @rmdir(‘F:/aaa‘)) //只能删除非空目录,如果删除不存在的目录自动抛出warning echo ‘remove successfully<br>‘;
那么问题来了,如果要删除一个非空目录咋办,又得自己写了,思想仍然是递归,因为php只提供了删除文件函数unlink,所以在删除一个目录时,先opendir,再进入,如果是文件直接删除,如果是目录,继续进入使用该方法处理,当然还可已返回一个bool变量表示删除是否成功,代码如下:
<?php // 删除文件 unlink // 删除目录中的内容,然后删除该目录 function clearDir($dirpath){ if(file_exists($dirpath)){ if(false != ($handle = opendir($dirpath))){ while(false != ($name = readdir($handle))){ if($name == ‘.‘ || $name == ‘..‘) continue; $filename = $dirpath.‘/‘.$name; if(is_dir($filename)) clearDir($filename); if(is_file($filename)) @unlink($filename); } closedir($handle); rmdir($dirpath); } else{ return false; } } else{ return false; } return true; }
在这里不得不说遇到的一个大坑,就是 . 和 .. 这两个鬼玩意儿(点和点点),在操作系统中的每一个文件夹下边,都会有 . 和 .. ,它们表示当前目录和当前目录的上级目录,可恶的是前面在读取目录时居然没显示,导致递归函数成了死循环,因为 . 和 .. 在每一个目录的最前面,必然会先读到它俩,若不过滤,首先读到 . ,它表示本目录,然后又递归进入本目录...这俩是操作系统下面的默认有的,它们是本目录与上级目录的连接符。
通过计算目录的大小和删除非空目录的代码,写复制和剪切目录就非常容易,非常相似的递归思想,需要用到复制文件函数copy,文件移动函数rename,这个挺有趣,rename,字面上是重命名,但是重命名到另一个目录中不就是剪切了么-_-
3.文件读写
php的某些文件读取操作跟C语言非常像,所以也比较简单,步骤就是先打开文件获取句柄,检查错误,然后读写处理,然后关闭,养成打开处理完后就关闭的好习惯,记得在C语言中的文件不关闭的话,打开两次是会报错滴,不知道记错没,所以严格点的程序都有非常多的处理,比如先验证文件存在,然后验证可读可写性,然后先关闭一下,然后再打开,打开时还得再检查打开错了没......在打开文件时,就要选择打开文件的模式,它决定了我们读还是写文件,当然是对需要这样操作的函数有用。
写文件,写文件函数只有fwrite、fputs、file_put_contents少数几个,其中fwrite与fputs效果一样,file_put_contents是一次性向文件写入一些内容,它就不需要指定打开模式,同时它也可以是附加或者覆盖现有文件内容,比如:
<?php // 写 fwrite(别名fputs) $filepath = ‘F:/10m.txt‘; function writeSome($filepath){ if(($handle = fopen($filepath, ‘r+‘)) == true){ for($i=0; $i<10; $i++) fwrite($handle, $i." write something\r\n"); // windws以\r\n作为换行符 fclose($handle); } } file_put_contents($filepath, ‘use file_put_contents function‘, FILE_APPEND); // 附加内容
读文件,读文件的函数多些,有fread(读取指定个字节)、fgetc(读取一个)、fgets(读取一行)、file(全部读取,按行分配到一个数组中返回)、file_get_contents(默认读取全部返回字符串)、readfile(直接将文件中内容输出到缓存,效果就是直接在浏览器上输出),伴随着fread、fget、fgets运行,文件指针会自动往后走。因此连续读最好是循环控制。读到文件末尾怎么办,EOF标识指示到达文件末尾,最好用feof检测是否到文件末尾。不多说,看代码:
<?php // fread读取 function readSome($filepath){ if(($handle = @fopen($filepath, ‘r‘)) == true){ while(!feof($handle)){ // 判断是否到达文件末尾 $str = fread($handle, 10); // fread读取时,文件指针自动向后移动 echo $str.‘<br>‘; } } }
如果想要读取方式更灵活,就要配合fseek、rewind使用,它们可以移动文件指针到具体位置,fseek十分灵活,可以直接移到开头或末尾,或从当前位置往前或后移动,读取想要的内容,ftell还可告知当前位置,比如:
<?php function readFun($filepath){ if(($handle = @fopen($filepath, ‘r‘)) != false){ echo ‘current position: ‘.ftell($handle).‘<br>‘; // 输出文件当前文件指针位置,以字节算,0表示开头 $str = fread($handle, 3); // 读取3个字节,同时指针自动后移3个字节 echo ‘read content: ‘.$str.‘<br>‘; echo ‘current position: ‘.ftell($handle).‘<br>‘; fseek($handle, 5, SEEK_CUR); // 将文件指针从当前位置后移5个字节 echo ‘current position: ‘.ftell($handle).‘<br>‘; $str = fread($handle, 5); echo ‘read content: ‘.$str.‘<br>‘; echo ‘current position: ‘.ftell($handle).‘<br>‘; rewind($handle); // 返回文件开头 echo ‘current position: ‘.ftell($handle).‘<br>‘; fseek($handle, 0, SEEK_END); // 移到文件末尾 echo ‘current position: ‘.ftell($handle).‘<br>‘; fclose($handle); // 关闭文件 } }
比如我现在使用该方法读取一个写有从a到z的文本文件,看看效果:
PHP之文件目录基础操作