python hash

首页 > 代码库 > python hash

2024-09-30 07:13:01 218人阅读

在 python3 中hash 技术分享

help(hash)

Help on built-in function hash in module builtins:

hash(obj, /)
    Return the hash value for the given object.#返回给定对象的哈希值

    Two objects that compare equal must also have the same hash value, but the
    reverse is not necessarily true.
    #两个比较相等的对象也必须有相同的散列值，但是逆转不一定是正确的。

Hash，一般翻译做“散列”，也有直接音译为“哈希”的，就是把任意长度的输入（又叫做预映射， pre-image），通过散列算法，变换成固定长度的输出，该输出就是散列值。

一个典型的空间换时间的算法，根据哈希出来的关键字进行快速的查询

构造方法：技术分享

① 直接寻址法

取关键字或关键字的某个线性函数值为散列地址。即H(key)=key或H(key) = a·key + b，

其中a和b为常数（这种散列函数叫做自身函数）

② 数字分析法

分析一组数据的某些特征，比如，比如在学校里用学生的年龄来作为标识的话，会有很大

的冲突率，如果利用学生的学号作为标识的话，冲突率就会大大下降，因此数字分析就是

找出这些特征的规律，尽可能利用这些数据来构成冲突几率较低的散列地址

③ 平方取中法

先平方后取中生成散列地址

④ 折叠法

均匀分割分别取和生成散列地址

⑤ 随机数法

选择一随机函数，取关键字的随机值作为散列地址，通常用于关键字长度不同的场合。

⑥ 除留余数法

取关键字被某个不大于散列表表长m的数p除后所得的余数为散列地址。即 H(key) =

key MOD p, p<=m。不仅可以对关键字直接取模，也可在折叠、平方取中等运算之后取模。

对p的选择很重要，一般取素数或m，若p选的不好，容易产生同义词。

处理冲突的方法技术分享

① 开放寻址法：Hi=(H(key) + di) MOD m,i=1,2,…，k(k<=m-1)，其中H(key)为散列函数，m为散列表长，

di为增量序列，可有下列三种取法：

1).di=1,2,3,…，m-1，称线性探测再散列；

2)． di=1^2,(-1)^2,2^2,(-2)^2,(3)^2,…，±(k)^2,(k<=m/2)称二次探测再散列；

3)． di=伪随机数序列，称伪随机探测再散列。

② 再散列法：Hi=RHi(key),i=1,2,…，k RHi均是不同的散列函数，即在同义词产生地址冲突

时计算另一个散列函数地址，直到冲突不再发生，这种方法不易产生“聚集”，但增加了计

算时间。

③ 链地址法（拉链法）

④ 建立一个公共溢出区

本文出自 “you_change_my_world” 博客，请务必保留此出处http://zj734627415.blog.51cto.com/12923684/1931913

python hash

声明：以上内容来自用户投稿及互联网公开渠道收集整理发布，本网站不拥有所有权，未作人工编辑处理，也不承担相关法律责任，若内容有误或涉及侵权可进行投诉：投诉/举报工作人员会在5个工作日内联系你，一经查实，本站将立刻删除涉嫌侵权内容。

联系
我们

首页 > 代码库 > python hash

python hash

看完仍有疑问？有类似问题直接问程序猿