牵着老婆满街逛

严以律己,宽以待人. 三思而后行.
GMail/GTalk: yanglinbo#google.com;
MSN/Email: tx7do#yahoo.com.cn;
QQ: 3 0 3 3 9 6 9 2 0 .

数据标准化/归一化方法

From:http://blog.holybbs.com/article.asp?id=170

归一化方法(Normalization Method)
1。 把数变为(0,1)之间的小数
        主要是为了数据处理方便提出来的,把数据映射到0~1范围之内处理,更加便捷快速,应该归到数字信号处理范畴之内。
2 。把有量纲表达式变为无量纲表达式
        归一化是一种简化计算的方式,即将有量纲的表达式,经过变换,化为无量纲的表达式,成为纯量。
比如,复数阻抗可以归一化书写:Z = R + jωL = R(1 + jωL/R) ,复数部分变成了纯数量了,没有量纲。
另外,微波之中也就是电路分析、信号系统、电磁波传输等,有很多运算都可以如此处理,既保证了运算的便捷,又能凸现出物理量的本质含义。

标准化方法(Normalization Method)
        数据的标准化是将数据按比例缩放,使之落入一个小的特定区间。由于信用指标体系的各个指标度量单位是不同的,为了能够将指标参与评价计算,需要对指标进行规范化处理,通过函数变换将其数值映射到某个数值区间。一般常用的有以下几种方法。

(1) 最小-最大规范化对原始数据进行线性变换。假定MaxA与MinA分别表示属性A的最大与最小值。最小最大规范化通过计算

将属性A的值映射到区间[a, b]上的v。一般来说,将最小-最大规范化在用于信用指标数据上,常用的有以下两种函数形式:
a) 效益型指标(越大越好型)的隶属函数:

b) 成本型指标(越小越好型)的隶属函数:

(2) z-score规范化也称零-均值规范化。属性A的值是基于A的平均值与标准差规范化,A的值计算公式

(3) 小数定标规范化是通过移动属性A的小数点位置来实现的。小数点的移动位数依赖于A的最大绝对值,计算公式为

其中,j是使得MAX(|v|)<1的最小整数。例如A的值为125,那么|A|=125,则j=3,有v=0.125。

///////////////////////////////////////////////////////////////////////////////////////////////////
//C++实现的归一化和反归一化处理函数
///////////////////////////////////////////////////////////////////////////////////////////////////
void __fastcall TModelManage::TranslateData(TModel* pModel,int Id,double *Value,int Flag)
{
  
//转换函数类型
  int iChgFunc;

  
//节点对应的最大、最小值
  double dMaxValue,dMinValue;

  
//取节点配置信息:转换函数类型,最大值,最小值
  GetNodeConfValue(pModel->ConfTable,Id,&iChgFunc,&dMaxValue,&dMinValue);
  
if(Flag==1)               //仿真时不取边界值,以避免仿真结果误差太大
  {
    
if(*Value<=(dMinValue*1.005))
        
*Value=dMinValue*1.005;
    
if(*Value>=(dMaxValue*0.995))
        
*Value=dMaxValue*0.995;
  }
  
else
  {
    
if(*Value<=dMinValue)
        
*Value=dMinValue;
    
if(*Value>=dMaxValue)
        
*Value=dMaxValue;
  }

  
//线性函数转换,转换在0-1之内
  if(iChgFunc==0)
  {
    
*Value=(*Value-dMinValue)/(dMaxValue-dMinValue);
  }
  
//用atan函数转换在0-1之内
  else if(iChgFunc==2)
  {
    
*Value=atan(*Value)*2/M_PI;
  }
  
//用log函数转换
  else if(iChgFunc==1)
  {
    
if(*Value<=1)
        
*Value=0;
    
else
        
*Value=log10(*Value); //用log10函数转换(缩小)
    if(dMaxValue>1)
        
*Value=*Value/log10(dMaxValue); //转换为0-1之间
  }
  
//不用转换
  else if(iChgFunc==3)
  {
      
*Value=*Value;
  }


  
*Value=((0.5-0.001)/0.5)*(*Value)+0.001;   //用线性函数把数据转换为0.001-0.0.9995之间
}

///////////////////////////////////////////////////////////////////////////////////////////////////
//反数据转换,主要是针对仿真结果要反算回实际预测的值
void __fastcall TModelManage::UnTranslateData(TModel* pModel,int Id,double *Value,int Flag)
{
  
//转换函数类型
  int iChgFunc;

  
//节点对应的最大、最小值
  double dMaxValue,dMinValue;

  
//取节点配置信息:转换函数类型,最大值,最小值
  GetNodeConfValue(pModel->ConfTable,Id,&iChgFunc,&dMaxValue,&dMinValue);
 
 
  
*Value=(((*Value)-0.001)*0.5)/(0.5-0.001);     //对应于---->用线性函数把数据转换为0.001-0.0.9995之间

  
//反线性函数转换
  if(iChgFunc==0)
  {
    
*Value=(*Value)*(dMaxValue-dMinValue)+dMinValue;
  }
  
//用tan函数转换
  else if(iChgFunc==2)
  {
    
*Value=tan(*Value)*M_PI/2;
  }
  
//用反log函数转换
  else if(iChgFunc==1)
  {
    
*Value=pow(10,(*Value)); //用反对数方式函数转换(放大)
  }
  
else if(iChgFunc==3)
  {
    
*Value=*Value; //不用转换
  }  
}
////////////////////////////////////////////////////////////////////////////////////////////////


posted on 2007-06-13 11:00 杨粼波 阅读(4126) 评论(0)  编辑 收藏 引用


只有注册用户登录后才能发表评论。
网站导航: 博客园   IT新闻   BlogJava   博问   Chat2DB   管理