Igor Sobreira

Conjuntos em Python - set e frozenset

Os conjuntos são um tipo de dados do python que nunca ouvi falar muito. Eu particularmente nunca usei, mas dando uma olhada agora vi que são muito interessantes.

Uma coisa que eu precisei fazer ontem foi retirar dados repedidos de uma lista, e não existe um método de lista que faça isso. Já nos conjuntos isso é automático, não existem dados repetidos.

A diferença entre set e frozenset, é que o primeiro é mutável, já o segunto não. Criando um conjunto...

>>> conjunto1 = set('12345')
>>> conjunto1
set(['1', '3', '2', '5', '4'])
>>>

Veja que é passado um tipo iterável para o set(nessa caso uma string), onde cada elemento vai ser um elemento do conjunto.

>>> conjunto2 = set([4,4,7,7,8,9])
>>> conjunto2
set([8, 9, 4, 7])

Veja que realmente ele não permite elementos repetidos. Você deve ter percebido que os elementos não estão na mesma ordem que foram passados. Isso porquê conjuntos realmente não possuem nenhuma ordem. São iteráveis, ou seja, podemos fazer for x in meu_conjunto, len(meu_conjunto), x in meu_conjunto. Mas como eles não possuem ordem, não é permitido indexação, nem slicing, algo tipo meu_conjunto[2:] está errado.

Mas vamos a algumas operações entre conjuntos.

Está contido e contém

>>> conjunto1.issubset(conjunto2)
False
>>> conjunto1.issubset(set('123456789'))
True
>>>

Também podemos usar os operadores

>>> conjunto1 <= set('123456789')
True
>>> set('123456789') >= conjunto1
True

União

>>> conjunto1.union(conjunto2)
set([4, 7, 8, 9, '1', '3', '2', '5', '4'])
>>> conjunto1 | conjunto2
set([4, 7, 8, 9, '1', '3', '2', '5', '4'])

Interseção

>>> set('123').intersection(set('345'))
set(['3'])
>>> set('123') & set('345')
set(['3'])

Diferença

>>> set('1234').difference(set('3'))
set(['1', '2', '4'])
>>>
>>> set('1234') - set('34')
set(['1', '2'])
>>>

Operações entre sets e frozensets são permitidas, mas veja que a ordem em que eles aparecem importa

>>> set('234') | frozenset('45')
set(['3', '2', '5', '4'])
>>> frozenset('23') | set('567')
frozenset(['3', '2', '5', '7', '6'])

Outra coisa importante, é que podemos passar iteráveis tanto na criação do set como nas operações usando os métodos. Mas as operações usando os operadores devem ser obrigatoriamente entre sets:

>>> set('234').union([5,6])
set(['3', '2', '4', 6, 5])
>>>
>>> set('234') | [2,3]
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
TypeError: unsupported operand type(s) for |: 'set' and 'list'
>>>

Os sets, por serem mutáveis, também possuem métodos que adicionar e remover novos elementos. Como os frozensets são imutáveis, não possuem esse métodos

>>> conjunto1 = set(['a','b','c','d'])
>>> conjunto1
set(['a', 'c', 'b', 'd'])
>>> conjunto1.update(set('nada'))
>>> conjunto1
set(['a', 'c', 'b', 'd', 'n'])
>>>

O conjunto.update(outro_conjunto), atualiza conjunto adicionando os elementos de outro_conjunto. Tem também os métodos set.add(x), set.remove(x), set.pop(), set.clear(). Além do set.discard(x), que só remove o elemento se ele existir, diferente do remove() que retorna KeyError caso o elemento não exista.

O exemplo que eu citei no começo, de retirar dados repetidos de uma lista poderia ter sido feito assim:

>>> numeros = [2,5,3,2,1,6,3,5,2,2]
>>> list( set(numeros) )
[1, 2, 3, 5, 6]

Simples não?

Veja mais detalhes sobre conjuntos aqui

blog comments powered by Disqus

My name is Igor Sobreira and is my website. I'm a software developer working at Real Geeks. I currently live in Hawaii doing the two things that I like most: windsurfing and writing software.

See more about me and get in touch.