I am saving my data into a dictionary and after saving it to the dictionary I printed the data to see what it looks like and I see the unicode:
(u'520775', [[u'Kategori:2. divisjon fotball for herrer 2008']]) (u'754686', [[u'Kategori:Debutalbum', u'Kategori:Musikkalbum fra 1990', u'Kategori:Tre Sm\xe5 Kinesere-album']]) (u'381191', [[u'Kategori:Serierundene i Adeccoligaen 2007']]) (u'972597', [[u'Kategori:Tippeligaen 2011']]) (u'263001', [[u'Kategori:Musikkalbum fra 2003']]) (u'23037', [[u'Kategori:Luftforsvaret']]) (u'640060', [[u'Kategori:Deltagermedaljen', u'Kategori:F\xf8dsler i 1923', u'Kategori:Norske folkemusikere', u'Kategori:Norske trekkspillere', u'Kategori:Paul Harris Fellow', u'Kategori:Personer fra Vefsn kommune']]) I have the following code, I used the format option but it didn't really work. What also confuses me is,when I print the id prior to saving it in dictionary, I see it without integer.
Here is the segment of the code,
for (pageId, pageData) in data['query']['pages'].iteritems(): categoryTitles = []; idTitleDictionary[pageId] = []; print pageId; try: for category in pageData['categories']: categoryTitles.append(category['title']); idTitleDictionary[format(pageId)].append(categoryTitles); I am trying it figure how to encode it prior to saving it into a dictionary.