我的CPP之路

路漫漫其修远兮
随笔 - 42, 文章 - 0, 评论 - 16, 引用 - 0
数据加载中……

[转]不同操作系统对文本文件“行结束符”的不同定义

http://dev.firnow.com/course/3_program/c++/cppsl/20081117/151346.html
不同操作系统对文本文件“行结束符”的不同定义

\n是换行,英文是LineFeed,ASCII码是0xA。
\r是回车,英文是Carriage Return ,ASCII码是0xD。

如果用过机械打字机,就知道回车和换行的区别了。。。
  换行就是把滚筒卷一格,不改变水平位置。 
  回车就是把水平位置复位,不卷动滚筒。


但是我们平时按得Enter到底是回车还是换行,不太清楚??
看到一种说法:windows下enter是 \n\r,unix下是\n,mac下是\r
在MS的系统中纯文本格式按一个回车键是输入了两个字符,一个回车一个换行。在LINUX系统中则只是一个回车。

Unix系统里,每行结尾只有“<换行>”,即“\n”;Windows系统里面,每行结尾是“<换行><回
车>”,即“\n\r”;Mac系统里,每行结尾是“<回车>”。一个直接后果是,Unix/Mac系统下的文件在
Windows里打
开的话,所有文字会变成一行;而Windows里的文件在Unix/Mac下打开的话,在每行的结尾可能会多出一个^M符号。Linux和其它Unix类操作系统使用单个字符作为行结束符,这个字符通常被称作“换行符”(LF)或“新行”(NL)。

Dos,Windows和OS2使用两个字符作为行结束符,一个“回车”(CR)和一个LF。

Mac OS只使用一个CR。

有些Linux配置文件对行结束符规范很敏感,所以尽量不要试图从Dos,windows或Mac OS系统中编辑Linux系统的配置文件。

---------分割线---------

还有一篇也是讲这个问题,作者还给出了一个解决方法:

[转]关于文本文件的格式------回车换行符(CR/LF)
http://www.felix021.com/blog/read.php?774
Unix和Windows間的文字檔轉換
http://www.siuying.net/articles/2005/11/18/524/

在用電報通訊的年代,人們發明了一種用7bits把常用的英文和標點編碼的方法 — 這就是至今還在電腦世界應用的ASCII。

電 報機每當打印到一行結尾時便需要「跳進下一行」並「回到第一格」,因此ASCII有LF(Line Feed, 0×0A) 和CR(Carriage Return, 0×0D)。在電腦的世其實並不需要用兩個字符代表「下一行」的意思,為了省資源,在設計OS時一些人就決定用其中一個字符代表「下一行」1,因為大家選擇不同,做成了不同系統的「下一行」符號不同的問題。

這 問題常見於在 Windows 上傳一些檔案到 Unix Server 中,如果不經轉換 Unix 會見到一些古怪符號 (顯示成^M的CR字符)。如果己經有一堆Windows的文字檔,怎樣把它們轉換成Unix的文字檔?不用自己寫轉換軟件,你可以使用Unix command tr (translate) 或 sed (Stream Editor):

# USE tr TO REMOVE CR CHARACTER
tr -d '\r' < oldfile > newfile


# USE sed, IN UNIX ENVIRONMENT: convert DOS newlines (CR/LF) to Unix format
sed 's/.$//' # assumes that all lines end with CR/LF
sed 's/^M$//' # in bash/tcsh, press Ctrl-V then Ctrl-M

# USE sed, IN UNIX ENVIRONMENT: convert Unix newlines (LF) to DOS format
sed "s/$/`echo -e \\\r`/" # command line under ksh
sed 's/$'"/`echo \\\r`/" # command line under bash


---------


posted on 2010-12-26 11:50 yanvenhom 阅读(1035) 评论(0)  编辑 收藏 引用 所属分类: UNIX


只有注册用户登录后才能发表评论。
网站导航: 博客园   IT新闻   BlogJava   知识库   博问   管理