集合Sets

Python之集合Sets的理解和使用

Posted by Ted on November 18, 2016

Set简介

set是一种很有用的数据结构,sets看起来和lists很像,不同的是sets里不能有重值,在许多情况下有用,

例如,你可能想要检查list中是否有重复的值。 你有两个选择。 第一个使用for循环,如下:

some_list = ['a', 'b', 'c', 'b', 'd', 'm', 'n', 'n']

duplicates = []
for value in some_list:
    if some_list.count(value) > 1:
        if value not in duplicates:
            duplicates.append(value)

print(duplicates)
# Output: ['b', 'n']

但是如果用sets的话,会有一个更简单高效的操作,像这样

some_list = ['a', 'b', 'c', 'b', 'd', 'm', 'n', 'n']
duplicates = set([x for x in some_list if some_list.count(x) > 1])
print(duplicates)
# Output: set(['b', 'n'])

集合创建

a_set = {'red', 'blue', 'green'}
print(type(a_set))
# Output: <type 'set'>

集合交集

你可以让两个集合sets求交集

valid = set(['yellow', 'red', 'blue', 'green', 'black'])
input_set = set(['red', 'brown'])
print(input_set.intersection(valid))
# Output: set(['red'])

会得到两个集合的交集部分

集合差异

同样可以用difference方法来求差异

valid = set(['yellow', 'red', 'blue', 'green', 'black'])
input_set = set(['red', 'brown'])
print(input_set.difference(valid))
# Output: set(['brown'])

参考资料:[set_-data_structure](http://book.pythontips.com/en/latest/set-_data_structure.html)