Prayer

在一般中寻求卓越
posts - 1256, comments - 190, trackbacks - 0, articles - 0
  C++博客 :: 首页 :: 新随笔 :: 联系 :: 聚合  :: 管理

DOS文件转换成UNIX文件格式详解

Posted on 2009-04-13 15:41 Prayer 阅读(725) 评论(0)  编辑 收藏 引用 所属分类: Shell
dos格式文件传输到unix系统时,会在每行的结尾多一个^M,当然也有可能看不到,但是在vi的时候,会在下面显示此文件的格式,比如 "dos.txt" [dos] 120L, 2532C 字样,表示是一个[dos]格式文件,如果是MAC系统的,会显示[MAC],因为文件格式的原因有时会导致我们的unix程序,或者shell程序出现错误,那么需要把这些dos文件格式转换成unix格式,方法是
    vi  dos.txt       
    :set fileformat=unix
    :w                
  这样文件就转换成unix格式文件了, 一般在windows机器上编写好了文件传到unix下就可能会出现这样的情况.
  用命令:set ff?  可以看到dos或unix的字样.
  用:set ff=unix把它强制为unix格式,
也可以用sed 这样的工具来做:
  sed 's/^M//' filename > tmp_filename
  其中^M是同时Ctrl+V+M按出来的,表示回车。

其它“怪招”:
1. 使用vi
vi dos_file.txt
:%s/^M//g
其中^M 必须是同时按 Ctrl+V+M ,表示回车。不是直接输入 ^M ,那没有用的, :-) 。
2. 使用tr
命令:tr -d "\015" dos_file.txt
3. 使用perl
cat dos_file.txt | perl -pe '~s/\r//g' > dos_file.txt
 
【VIM】DOS、Mac 和 Unix 文件
http://vimcdoc.sourceforge.net/doc/usr_23.html
很久以前,老式的电传打字机使用两个字符来另起新行。一个字符把滑动架移回首位 (称
为回车,<CR>),另一个字符把纸上移一行 (称为换行,<LF>)。
   当计算机问世以后,存储器曾经非常昂贵。有些人就认定没必要用两个字符来表示行
尾。UNIX 开发者决定他们可以用 <Line Feed> 一个字符来表示行尾。Apple 开发者规定
了用 <CR>。开发 MS-DOS (以及微软视窗) 的那些家伙则决定沿用老式的 <CR><LF>。
   那意味着,如果你试图把一个文件从一种系统移到另一种系统,那么你就有换行符方
面的麻烦。Vim 编辑器自动识别不同文件格式,并且不劳你操心就把事情给办妥了。
   选项 'fileformats' 包含各种各样的格式,Vim 会在编辑一个新文件之初尝试该选项
定义的各种格式。例如,下面这个命令告诉 Vim 先尝试用 UNIX 格式,其次,尝试
MS-DOS 格式:
        :set fileformats=unix,dos
编辑一个文件时,你将注意到 Vim 给出的信息消息报中包括文件所用的格式。如果你编
辑的是本地格式文件 (你编辑的文件格式和所用系统一致),你就不会看到任何格式名。
因此在 Unix 系统上编辑一个 Unix 格式文件不会产生任何关于格式的信息。但你若编辑
一个 dos 文件,Vim 将这样通知你:
        "/tmp/test" [dos] 3L,71C
如果是 Mac 文件,你会看到 "[mac]"。
   探测到的文件格式会被存入 'fileformat' 选项。执行下面这个命令可以显示你当前
使用的文件格式:
        :set fileformat?
Vim 能使用的三种格式如下:
        unix            <LF>
        dos             <CR><LF>
        mac             <CR>

使 用 MAC 格 式
在 Unix 上,<LF> 用于分行。但 <CR> 字符混在文本行中间也非罕见。这种情况碰巧经
常发生在 Vi (和 Vim) 脚本内。
   在采用 <CR> 作为换行符的 Macintosh 上,<LF> 字符也有可能混在文本行中间。
   结果,很难 100% 肯定一个同时包含 <CR> 和 <LF> 的文件究竟是 Mac 还是 Unix 格
式。所以,Vim 假设你一般不会在 Unix 上编辑一个 Mac 文件,所以干脆对这种文件格
式不作检查。果真要检查此种格式,就把 "mac" 加入 'fileformats':
        :set fileformats+=mac
然后 Vim 就会猜测文件格式。要当心, Vim 可能会猜错的。

强 制 格 式
如果你用往日美好的 Vi 来尝试编辑一个采用 MS-DOS 格式的文件,你将会发现每一行的
末尾有个 ^M 字符。(^M 就是 <CR>)。而 Vim 的自动探测功能就避免了这个问题。莫非
你确实要按那个样子来编辑这个文件吗?那么你需要强制 Vim 忽略文件格式而使用你指
定的格式:
        :edit ++ff=unix file.txt
字符串 "++" 告诉 Vim 后面跟的是选项名,以取代其默认值。但仅作用于这一个命令。
"++ff" 用于 'fileformat' 选项。你也可以用 "++ff=mac" 或 "++ff=dos"。
   这样用法并非适用于任意选项,目前 Vim 仅仅实现了 "++ff" 和 "++enc"。用全称
"++fileformat" 和 "++encoding" 也行。

转 换
你可以用 'fileformat' 选项把文件从一种格式转换为另一种。例如,假定你有个名为
README.TXT 的 MS-DOS 文件,你要把它转换成 UNIX 格式。首先编辑这个采用 MS-DOS
格式的文件:
        vim README.TXT
Vim 将识别出那是一个 dos 格式文件。现在把这个文件的格式改为 UNIX:
        :set fileformat=unix
        :write
这个文件就以 Unix 格式存盘了。

 

 原文地址 http://vimcdoc.sourceforge.net/doc/usr_23.html

只有注册用户登录后才能发表评论。
网站导航: 博客园   IT新闻   BlogJava   博问   Chat2DB   管理