大龙的博客
导航
C++博客
首页
新随笔
联系
聚合
管理
<
2012年12月
>
日
一
二
三
四
五
六
25
26
27
28
29
30
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
1
2
3
4
5
留言簿
(43)
给我留言
查看公开留言
查看私人留言
收藏夹
ps
(rss)
随笔档案
2014年10月 (1)
2014年8月 (4)
2014年6月 (1)
2013年12月 (6)
2013年11月 (2)
2013年10月 (5)
2013年9月 (4)
2013年7月 (1)
2013年6月 (2)
2013年3月 (1)
2013年2月 (20)
2013年1月 (10)
2012年12月 (8)
2012年11月 (5)
2012年10月 (9)
2012年9月 (4)
2012年8月 (16)
2012年7月 (8)
2012年6月 (10)
2012年5月 (11)
2012年4月 (3)
2012年3月 (10)
2012年2月 (6)
2012年1月 (4)
2011年12月 (6)
2011年11月 (16)
2011年10月 (32)
2011年9月 (13)
2011年8月 (6)
2011年7月 (27)
2011年6月 (18)
2011年5月 (12)
2011年4月 (2)
2011年3月 (1)
2011年2月 (5)
2011年1月 (24)
2010年12月 (5)
2010年11月 (2)
2010年10月 (3)
2010年9月 (4)
2010年8月 (7)
2010年6月 (13)
2010年5月 (18)
2010年4月 (21)
2010年3月 (6)
2010年2月 (7)
2010年1月 (7)
2009年12月 (7)
2009年11月 (2)
2009年10月 (8)
2009年9月 (19)
2009年8月 (11)
2009年6月 (28)
2009年5月 (35)
2009年4月 (18)
2009年3月 (24)
2009年2月 (13)
2009年1月 (10)
2008年12月 (2)
2008年11月 (6)
2008年10月 (4)
2008年9月 (11)
2008年8月 (18)
2008年7月 (8)
2008年6月 (19)
2008年5月 (9)
2008年4月 (6)
2008年3月 (2)
2008年2月 (4)
2008年1月 (21)
2007年12月 (14)
2007年11月 (4)
2007年10月 (7)
2007年9月 (17)
2007年8月 (10)
2007年7月 (20)
2007年6月 (11)
2007年5月 (8)
2007年4月 (13)
2007年3月 (2)
2007年2月 (6)
2007年1月 (14)
2006年12月 (23)
2006年11月 (15)
2006年10月 (5)
2006年9月 (4)
文章档案
2007年11月 (1)
2006年12月 (1)
阅读排行榜
1. LinuxShell算术运算(49302)
2. Windows XP DDK 的有效下载地址(45101)
3. WinDBG教程(40925)
4. Android 打包签名 从生成keystore到完成签名 -- 转(40652)
5. 在Cygwin上安装编辑器vim (38989)
评论排行榜
1. Windows XP DDK 的有效下载地址(116)
2. 在Cygwin上安装编辑器vim (24)
3. (TCP-over-UDP library):基于UDP协议之上实现通用、可靠、高效的TCP协议 ---------- 转(14)
4. Compuware DriverStudio V3.2(10)
5. 经典好书 (10)
常用链接
我的随笔
我的评论
我参与的随笔
统计
随笔 - 864
文章 - 2
评论 - 378
引用 - 0
最新评论
1. re: 安装Nexus私服
谢谢博主。我刚学搭建nexus,挺不错的。
--做有为青年
2. re: 用slf4j+logback实现多功能日志解决方案 --- 转
谢谢楼主,整个流程非常清楚,照着做了一遍就会了。另外我分享一个logback目前尚存在的bug:当你发现INFO级和ERROR级的日志没有写成功时,上下移动一下配置文件中appender的位置就好了。
--welldone
3. re: LinuxShell算术运算
你这些都验证过吗
--是是是
4. re: 用slf4j+logback实现多功能日志解决方案 --- 转
写的非常好!
--Hello
5. re: (TCP-over-UDP library):基于UDP协议之上实现通用、可靠、高效的TCP协议 ---------- 转
评论内容较长,点击标题查看
--pcplayer
hashcode重复的可能性超大(转)
用String的hashcode得到int类型作为主键。其实hashcode重复的可能性超大,下面是java的缺省算法:
public
int
hashCode()
{
int
h
=
hash;
if
(h
==
0
)
{
int
off
=
offset;
char
val[]
=
value;
int
len
=
count;
for
(
int
i
=
0
; i
<
len; i
++
)
{
h
=
31
*
h
+
val[off
++
];
}
hash
=
h;
}
return
h;
}
但是什么情况下会重复?下面是测试代码
import java.util.HashMap;
public
class
Test
{
static
HashMap map
=
new
HashMap();
private
static
char
startChar
=
'
A
'
;
private
static
char
endChar
=
'
z
'
;
private
static
int
offset
=
endChar
-
startChar
+
1
;
private
static
int
dup
=
0
;
public
static
void
main(String[] args)
{
int
len
=
3
;
char
[] chars
=
new
char
[len];
tryBit(chars, len);
System.
out
.println((
int
)Math.pow(offset, len)
+
"
:
"
+
dup);
}
private
static
void
tryBit(
char
[] chars,
int
i)
{
for
(
char
j
=
startChar; j
<=
endChar; j
++
)
{
chars[i
-
1
]
=
j;
if
(i
>
1
)
tryBit(chars, i
-
1
);
else
test(chars);
}
}
private
static
void
test(
char
[] chars)
{
String str
=
new
String(chars).replaceAll(
"
[^a-zA-Z_]
"
,
""
).toUpperCase();
//
195112:0
//
String str = new String(chars).toLowerCase();
//
195112:6612
//
String str = new String(chars).replaceAll("[^a-zA-Z_]","");
//
195112:122500
//
String str = new String(chars);
//
195112:138510
int
hash
=
str.hashCode();
if
(map.containsKey(hash))
{
String s
=
(String) map.
get
(hash);
if
(
!
s.equals(str))
{
dup
++
;
System.
out
.println(s
+
"
:
"
+
str);
}
}
else
{
map.put(hash, str);
//
System.out.println(str);
}
}
}
在A-z范围内有特殊字符,从结果看,仅仅3位长度的字符串:
不处理: 138510次重复
去掉字母意外字符: 122500次重复
所有字符转小写:6612次重复(少了很多)
去掉字母意外字符,并且转小写:没有重复!4位字符串也没见重复
不难看出:
1. 缺省实现为英文字母优化
2. 字母大小写可能导致重复
可能:
长字符串可能hashcode重复
中文字符串和特殊字符可能hashcode重复
注:由于是2006年的事,所以上面得出的数据有误。可自己进行测试。hash冲突次数大大减少。
posted on 2014-08-31 14:59
大龙
阅读(905)
评论(0)
编辑
收藏
引用
只有注册用户
登录
后才能发表评论。
【推荐】100%开源!大型工业跨平台软件C++源码提供,建模,组态!
网站导航:
博客园
IT新闻
BlogJava
博问
Chat2DB
管理
Powered by:
C++博客
Copyright © 大龙