1. 程式人生 > >Python面試題 —— 計算列表中出現最多次的字元

Python面試題 —— 計算列表中出現最多次的字元

題目:
給你一個其中包含不同的英文字母和標點符號的文字,你要找到其中出現最多的字母,返回的字母必須是小寫形式, 當檢查最想要的字母時,不區分大小寫,所以在你的搜尋中 “A” == “a”。 請確保你不計算標點符號,數字和空格,只計算字母。
如果你找到 兩個或兩個以上的具有相同的頻率的字母, 返回那個先出現在字母表中的字母。 例如 – “one”包含“o”,“n”,“e”每個字母一次,因此我們選擇“e”。
解答:
法一:
利用collections工具中的Counter,對列表中元素出現頻率進行排序。Counter返回值是一個按元素出現頻率降序排列的Counter物件,它是字典的子類,因此可以使用字典的方法。

import re
from collections import Counter
def get_max_value(text):
text = text.lower()
result = re.findall(’[a-zA-Z]’, text) # 去掉列表中的符號符
count = Counter(result) # Counter({‘l’: 3, ‘o’: 2, ‘d’: 1, ‘h’: 1, ‘r’: 1, ‘e’: 1, ‘w’: 1})
count_list = list(count.values())
max_value = max(count_list)
max_list = []
for k, v in count.items():
if v == max_value:
max_list.append(k)
max_list = sorted(max_list)
return max_list[0]

法二:
同樣是使用Counter,但是通過列表推導式,可以使函式更加精煉。這就是列表推導式的好處。


> from collections import Counter
def get_max_value(text):
    count = Counter([x for x in text.lower() if x.isalpha()])
    m = max(count.values())
    return sorted([x for (x, y) in count.items() if y == m])[0]
> 

最佳方法:
不得不稱讚這種方法,實在是乾脆利落。它巧妙的使用了max()函式。

import string
def get_max_value(text):
	text = text.lower()
        return max(string.ascii_lowercase, key=text.count)

利用了max()函式的key引數,巧妙的將出現次數最多的字元提取出來。

max(arg1, arg2, *args, *[, key=func]) -> value

我來為大家解釋一下max(string.ascii_lowercase, key=text.count)這句程式碼的原理。
string.ascii_lowercase 等價於 ‘abcdefghijklmnopqrstuvwxyz’ 而max()函式key引數的作用是:篩選符合key函式的返回值的最大值,如果有多個符合條件的值,則選取第一個。

max(range(6), key = lambda x : x>2)
 >>> 3 
# 帶入key函式中,各個元素返回布林值,相當於[False, False, False, True, True, True] 
# key函式要求返回值為True,有多個符合的值,則挑選第一個。 
max([3,5,2,1,4,3,0], key = lambda x : x)
>>> 5
# 帶入key函式中,各個元素返回自身的值,最大的值為5,返回5.
max('ah', 'bf', key=lambda x: x[1])
>>> 'ah'
# 帶入key函式,各個字串返回最後一個字元,其中'ah'的h要大於'bf'中的f,因此返回'ah'
max('ah', 'bf', key=lambda x: x[0])
>>> 'bf'
# 帶入key函式,各個字串返回第一個字元,其中'bf'的b要大於'ah'中的a,因此返回'bf'
max('abcdefghijklmnopqrstuvwxyz', key=text.count)
 text = 'Hello World'
>>> 'l'
# 帶入key函式,返回各個字元在'Hello World'中出現的次數,出現次數最多的字元為'l',因此輸出'l'