19、数据结构与算法 - 基础:插值查找

1、插值查找

插值查找是根据查找关键字与查找表中最大最小关键字比较后的查找方法。插值查找基于二分查找,将查找点的选择改进为自适应选择,提高查找效率

2、插值查找基本思想

插值查找类似平时我们查字典的时候,查一个以 s 开头的单词时,绝对不会用二分查找,从字典的中间第一页开始,因为我们知道它的大概位置是在字典的较后面部分,所以可以从后面的某处查起。我们先从首字母 s 的地方开始查找,然后再根据第二个字母在字母表中的位置,找到对应位置再继续查找,这样重复这个过程,直到找到我们查找的这个单词这就是插值查找的基本思想

插值查找除了要求查找的数据是顺序存储的有序数据外,还要求根据元素的关键字在数据中均匀分布,这样就可以按照比例插值

3、插值查找算法原理

  • 插值查找算法类似二分查找,不同的是每次从自适应 mid 处开始查找,而不是每次折半从中间开始查找

假设一个数组 [0, 1, 2, 3, 4, 5, 6, 7, 8, 9],这个数组相邻元素差为 1,满足均匀分布,如果我们要查找元素 3,我们可以先计算数组中小于等于 3 的元素所占元素的比例为 mid = (3 - 0) / (9 - 0) = 3/9,数组的长度 n = 10,我们期望查找的索引为 [n * mid] = 3,对应的元素为3,恰好为我们要找的元素。我们可以得到一个公式

left 为左边索引,right 为右边索引,key 为要查找的元素
mi d = l e f t + k e y − a r r [ l e f t ] a r r [ r i g h t ] − a r r [ l e f t ] ( r i g h t − l e f t ) = l e f t + ( k e y − a r r [ l e f t ] ) ( r i g h t − l e f t ) a r r [ r i g h t ] − a r r [ l e f t ] mid = left + \frac{key - arr[left]}{arr[right] - arr[left]} (right - left) = left + \frac{(key - arr[left])(right - left )} {arr[right] - arr[left]} mid=left+arr[right]−arr[left]key−arr[left](right−left)=left+arr[right]−arr[left](key−arr[left])(right−left)

4、插值查找代码实现

 /**
* @param arr   数组
* @param left  左边索引
* @param right 右边索引
* @param value 要查找的值
* @return 找到返回下标,未找到返回 -1
* @descrption 插值查找算法基于二分查找需要数组有序
*/
public static int insertValueSearch(int[] arr, int left, int right, int value) {

    if (left > right || value < arr[0] || value > arr[arr.length - 1]) {

        return -1;
    }

    int mid = left + (right - left) * (value - arr[left]) / (arr[right] - arr[left]);
    int midValue = arr[mid];
    if (value > midValue) {

        return insertValueSearch(arr, mid, right, value);
    } else if (value < midValue) {

        return insertValueSearch(arr, left, mid - 1, value);
    } else {

        return mid;
    }
}