这是索引二分的第八篇算法,力扣链接
给你一个整数数组
citations
,其中citations[i]
表示研究者的第i
篇论文被引用的次数。计算并返回该研究者的h
指数。根据维基百科上 h 指数的定义:
h
代表“高引用次数” ,一名科研人员的h
指数 是指他(她)至少发表了h
篇论文,并且 至少 有h
篇论文被引用次数大于等于h
。如果h
有多种可能的值,h
指数 是其中最大的那个。示例 1:
输入:citations = [3,0,6,1,5]
输出:3 解释:给定数组表示研究者总共有 5 篇论文,每篇论文相应的被引用了 3, 0, 6, 1, 5 由于研究者有 3 篇论文每篇 至少 被引用了 3 次,其余两篇论文每篇被引用 不多于 3 次,所以她的 h 指数是 3。
第一反应是看懵了,第二反应是不急,我们一点一点分析问题。
首先这个h不是指数组里的值,数组里的值要大于等于h
然后这个h的指数是指至少发表了 h
篇论文,代表一定存在len >= h
其次,至少 有 h
篇论文被引用次数大于等于 h,假设这个是个有序数组,citations[len-h] >= h
老规矩,上暴力法试试,先将数组排序,从右到左技术,如果h < citation[i] 解h++
func hIndex(citations []int) int {sort.Ints(citations)result := 0for i := len(citations) - 1; i >= 0; i-- {if citations[i] > result {result++}}return result
}
这个算法的耗时瓶颈在排序算法上,所以考虑不用排序,该用打表的方式记录所有的次数,但是怎么打表呢?我们可以开一个从0~n的数组,对于大于长度的数组值当n处理。打表结束之后再倒序计数,比较当前的文章数和引用总次数。
func hIndex(citations []int) int {count := make([]int, len(citations)+1)for _, num := range citations {if num > len(citations) {count[len(citations)]++} else {count[num]++}}total := 0for i := len(count) - 1; i >= 0; i-- {total += count[i]if total >= i {return i}}return 0
}
上面暂时都归类为暴力法,回归正题,我们还是得用二分法解决问题。
明确这个问题,找的不是数组的值,而是找的其实是数组的长度,即论文个数(体会一下这个问题)。所以二分法来说,其实也是有序的。我们根据mid的值,统计符合目标的引用次数,移动mid指针。
func hIndex(citations []int) int {l, r := 0, len(citations)for l <= r {mid := l + (r-l)/2count := 0for _, num := range citations {if num >= mid {count++}}if count >= mid {l = mid + 1} else {r = mid - 1}}return l
}