牵着老婆满街逛

严以律己,宽以待人. 三思而后行.
GMail/GTalk: yanglinbo#google.com;
MSN/Email: tx7do#yahoo.com.cn;
QQ: 3 0 3 3 9 6 9 2 0 .

数据标准化/归一化方法

From:http://blog.holybbs.com/article.asp?id=170

归一化方法（Normalization Method）
1。把数变为（0，1）之间的小数
        主要是为了数据处理方便提出来的，把数据映射到0～1范围之内处理，更加便捷快速，应该归到数字信号处理范畴之内。
2 。把有量纲表达式变为无量纲表达式
        归一化是一种简化计算的方式，即将有量纲的表达式，经过变换，化为无量纲的表达式，成为纯量。
比如，复数阻抗可以归一化书写：Z = R + jωL = R(1 + jωL/R) ，复数部分变成了纯数量了，没有量纲。
另外，微波之中也就是电路分析、信号系统、电磁波传输等，有很多运算都可以如此处理，既保证了运算的便捷，又能凸现出物理量的本质含义。

标准化方法（Normalization Method）
        数据的标准化是将数据按比例缩放，使之落入一个小的特定区间。由于信用指标体系的各个指标度量单位是不同的，为了能够将指标参与评价计算，需要对指标进行规范化处理，通过函数变换将其数值映射到某个数值区间。一般常用的有以下几种方法。

(1) 最小-最大规范化对原始数据进行线性变换。假定MaxA与MinA分别表示属性A的最大与最小值。最小最大规范化通过计算

将属性A的值映射到区间[a, b]上的v。一般来说，将最小-最大规范化在用于信用指标数据上，常用的有以下两种函数形式：
a) 效益型指标（越大越好型）的隶属函数：

b) 成本型指标（越小越好型）的隶属函数：

(2) z-score规范化也称零-均值规范化。属性A的值是基于A的平均值与标准差规范化，A的值计算公式

(3) 小数定标规范化是通过移动属性A的小数点位置来实现的。小数点的移动位数依赖于A的最大绝对值，计算公式为

其中，j是使得MAX（|v|）<1的最小整数。例如A的值为125，那么|A|=125，则j=3，有v=0.125。

///////////////////////////////////////////////////////////////////////////////////////////////////
//C++实现的归一化和反归一化处理函数
///////////////////////////////////////////////////////////////////////////////////////////////////
void __fastcall TModelManage::TranslateData(TModel* pModel,int Id,double *Value,int Flag)
{
  //转换函数类型
  int iChgFunc;

  //节点对应的最大、最小值
  double dMaxValue,dMinValue;

  //取节点配置信息：转换函数类型，最大值，最小值
  GetNodeConfValue(pModel->ConfTable,Id,&iChgFunc,&dMaxValue,&dMinValue);
  if(Flag==1)               //仿真时不取边界值，以避免仿真结果误差太大
  {
    if(*Value<=(dMinValue*1.005))
        *Value=dMinValue*1.005;
    if(*Value>=(dMaxValue*0.995))
        *Value=dMaxValue*0.995;
  }
  else
  {
    if(*Value<=dMinValue)
        *Value=dMinValue;
    if(*Value>=dMaxValue)
        *Value=dMaxValue;
  }

  //线性函数转换,转换在0-1之内
  if(iChgFunc==0)
  {
    *Value=(*Value-dMinValue)/(dMaxValue-dMinValue);
  }
  //用atan函数转换在0-1之内
  else if(iChgFunc==2)
  {
    *Value=atan(*Value)*2/M_PI;
  }
  //用log函数转换
  else if(iChgFunc==1)
  {
    if(*Value<=1)
        *Value=0;
    else
        *Value=log10(*Value); //用log10函数转换(缩小)
    if(dMaxValue>1)
        *Value=*Value/log10(dMaxValue); //转换为0-1之间
  }
  //不用转换
  else if(iChgFunc==3)
  {
      *Value=*Value;
  }

  *Value=((0.5-0.001)/0.5)*(*Value)+0.001;   //用线性函数把数据转换为0.001-0.0.9995之间
}

///////////////////////////////////////////////////////////////////////////////////////////////////
//反数据转换，主要是针对仿真结果要反算回实际预测的值
void __fastcall TModelManage::UnTranslateData(TModel* pModel,int Id,double *Value,int Flag)
{
  //转换函数类型
  int iChgFunc;

  //节点对应的最大、最小值
  double dMaxValue,dMinValue;

  //取节点配置信息：转换函数类型，最大值，最小值
  GetNodeConfValue(pModel->ConfTable,Id,&iChgFunc,&dMaxValue,&dMinValue);

  *Value=(((*Value)-0.001)*0.5)/(0.5-0.001);     //对应于---->用线性函数把数据转换为0.001-0.0.9995之间

  //反线性函数转换
  if(iChgFunc==0)
  {
    *Value=(*Value)*(dMaxValue-dMinValue)+dMinValue;
  }
  //用tan函数转换
  else if(iChgFunc==2)
  {
    *Value=tan(*Value)*M_PI/2;
  }
  //用反log函数转换
  else if(iChgFunc==1)
  {
    *Value=pow(10,(*Value)); //用反对数方式函数转换(放大)
  }
  else if(iChgFunc==3)
  {
    *Value=*Value; //不用转换
  }
}
////////////////////////////////////////////////////////////////////////////////////////////////

posted on 2007-06-13 11:00 杨粼波阅读(4128) 评论(0) 编辑收藏引用

只有注册用户登录后才能发表评论。
【推荐】100%开源！大型工业跨平台软件C++源码提供，建模，组态！



网站导航: 博客园 IT新闻 BlogJava 博问 Chat2DB 管理

牵着老婆满街逛

导航

统计

公告

常用链接

留言簿(11)

随笔分类(466)

随笔档案(1513)

文章分类(46)

文章档案(45)

相册

收藏夹(39)

工具官网

技术网站

开源网站

其他窝点

收藏网站

银行官网

友情链接

资源共享

搜索

积分与排名

最新评论

阅读排行榜

数据标准化/归一化方法