Сериализуемые объекты Python json

class gpagelet:
    """
    Holds   1) the pagelet xpath, which is a string
            2) the list of pagelet shingles, list
    """
    def __init__(self, parent):
        if not isinstance( parent, gwebpage):
            raise Exception("Parent must be an instance of gwebpage")
        self.parent = parent    # This must be a gwebpage instance
        self.xpath = None       # String
        self.visibleShingles = [] # list of tuples
        self.invisibleShingles = [] # list of tuples
        self.urls = [] # list of string

class gwebpage:
    """
    Holds all the datastructure after the results have been parsed
    holds:  1) lists of gpagelets
            2) loc, string, location of the file that represents it
    """
    def __init__(self, url):
        self.url = url              # Str
        self.netloc = False         # Str
        self.gpagelets = []         # gpagelets instance
        self.page_key = ""          # str

Есть ли способ сделать мой класс json сериализуемым? Меня беспокоит рекурсивная ссылка.


person Community    schedule 22.09.2009    source источник
comment
этот ответ может быть полезен: stackoverflow.com/a/28253689/303114   -  person danfromisrael    schedule 09.04.2015
comment
название вашего вопроса очень расплывчато. Вы должны улучшить его.   -  person Charlie Parker    schedule 04.02.2017
comment
тот же вопрос с закрытым ответом: stackoverflow.com/a/7409526/2728644   -  person dasons    schedule 03.06.2017


Ответы (5)


Напишите свой собственный кодировщик и декодер, который может быть очень простым, например return __dict__

например вот кодировщик для вывода полностью рекурсивной древовидной структуры, вы можете улучшить его или использовать как есть для своих целей

import json

class Tree(object):
    def __init__(self, name, childTrees=None):
        self.name = name
        if childTrees is None:
            childTrees = []
        self.childTrees = childTrees

class MyEncoder(json.JSONEncoder):
    def default(self, obj):
        if not isinstance(obj, Tree):
            return super(MyEncoder, self).default(obj)

        return obj.__dict__

c1 = Tree("c1")
c2 = Tree("c2") 
t = Tree("t",[c1,c2])

print json.dumps(t, cls=MyEncoder)

он печатает

{"childTrees": [{"childTrees": [], "name": "c1"}, {"childTrees": [], "name": "c2"}], "name": "t"}

вы можете аналогичным образом написать декодер, но там вам как-то нужно будет определить, ваш это объект или нет, так что, возможно, вы можете указать и тип, если это необходимо.

person Anurag Uniyal    schedule 22.09.2009
comment
В документации для simplejson прямо говорится, что вы должны вызывать JSONEncoder.default() для повышения TypeError, поэтому я думаю, что было бы лучше заменить ваш вызов вызовом этого. - person slacy; 03.01.2012
comment
Или, что еще лучше, реализуйте свой собственный подкласс [simple]json.JSONEncoder и перезапишите метод default версией, которая возвращает сериализуемое представление ваших объектов или вызывает JSONEncoder.default для всех других типов. См. docs.python.org/library/json.html#json.JSONEncoder. - person Chris Arndt; 23.01.2012
comment
@ChrisArndt, разве это не то, что делает описанный выше метод Анурага? - person zakdances; 03.03.2013
comment
@yourfiendzak Мой комментарий старше последнего редактирования ответа, поэтому я, вероятно, имел в виду более раннюю версию. - person Chris Arndt; 19.03.2013

jsonpickle ЗА ПОБЕДУ!

(Только что был тот же вопрос... json pickle обрабатывает рекурсивные/вложенные графы объектов, а также короткие замыкания для циклических графов объектов).

person longda    schedule 13.06.2012

Косвенный ответ: вместо использования JSON вы можете использовать YAML, который без проблем делает то, что вы хотите. (JSON по сути является подмножеством YAML.)

Пример:

import yaml
o1 = gwebpage("url")
o2 = gpagelet(o1)
o1.gpagelets = [o2]
print yaml.dump(o1)

На самом деле, YAML прекрасно обрабатывает циклические ссылки.

person Eric O Lebigot    schedule 22.09.2009
comment
Интересная статья, но в этом ответе не рассол, а только маринование (т.е. не load(), а dump()). - person Eric O Lebigot; 05.02.2013
comment
Действительно, но это стоит иметь в виду. Кроме того, зачем вам что-то мариновать, если вы не планируете использовать это позже?... - person Sardathrion - against SE abuse; 05.02.2013
comment
Верно. Однако совершенно безопасно load() YAML dumped приведенным выше кодом (это не может привести к интерпретации кода Python, за исключением ошибки в PyYAML, поскольку исходный код показывает [без внедрения кода Python… ]). - person Eric O Lebigot; 05.02.2013
comment
Да, мы согласны: это безопасно в этом случае, но не обязательно во всех всех случаях. Я параноик и экстраполирую использование вашего примера. Таким образом, просто (то, что началось как) небольшой комментарий. - person Sardathrion - against SE abuse; 05.02.2013

Я реализовал очень простой метод todict с помощью https://stackoverflow.com/a/11637457/1766716.

  • Перебирать свойства, которые не начинаются с __
  • Исключить методы
  • Удалите некоторые свойства вручную, которые не нужны (в моем случае, исходя из sqlalcemy)

И использовал getattr для создания словаря.

class User(Base):
    id = Column(Integer, primary_key=True)
    firstname = Column(String(50))
    lastname = Column(String(50))
    password = Column(String(20))
    def props(self):
        return filter(
            lambda a:
            not a.startswith('__')
            and a not in ['_decl_class_registry', '_sa_instance_state', '_sa_class_manager', 'metadata']
            and not callable(getattr(self, a)),
            dir(self))
    def todict(self):
        return {k: self.__getattribute__(k) for k in self.props()}
person guneysus    schedule 06.03.2016

Мое решение для этого состояло в том, чтобы расширить класс 'dict' и выполнить проверки обязательных/разрешенных атрибутов, переопределив методы класса init, update и set.

class StrictDict(dict):
    required=set()
    at_least_one_required=set()
    cannot_coexist=set()
    allowed=set()
    def __init__(self, iterable={}, **kwargs):
        super(StrictDict, self).__init__({})
        keys = set(iterable.keys()).union(set(kwargs.keys()))
        if not keys.issuperset(self.required):
            msg = str(self.__class__.__name__) + " requires: " + str([str(key) for key in self.required])
            raise AttributeError(msg)
        if len(list(self.at_least_one_required)) and len(list(keys.intersection(self.at_least_one_required))) < 1:
            msg = str(self.__class__.__name__) + " requires at least one: " + str([str(key) for key in self.at_least_one_required])
            raise AttributeError(msg)
        for key, val in iterable.iteritems():
            self.__setitem__(key, val)
        for key, val in kwargs.iteritems():
            self.__setitem__(key, val)

    def update(self, E=None, **F):
        for key, val in E.iteritems():
            self.__setitem__(key, val)
        for key, val in F.iteritems():
            self.__setitem__(key, val)
        super(StrictDict, self).update({})

    def __setitem__(self, key, value):
        all_allowed = self.allowed.union(self.required).union(self.at_least_one_required).union(self.cannot_coexist)
        if key not in list(all_allowed):
            msg = str(self.__class__.__name__) + " does not allow member '" + key + "'"
            raise AttributeError(msg)
        if key in list(self.cannot_coexist):
            for item in list(self.cannot_coexist):
                if key != item and item in self.keys():
                    msg = str(self.__class__.__name__) + "does not allow members '" + key + "' and '" + item + "' to coexist'"
                    raise AttributeError(msg)
        super(StrictDict, self).__setitem__(key, value)

Пример использования:

class JSONDoc(StrictDict):
    """
    Class corresponding to JSON API top-level document structure
    http://jsonapi.org/format/#document-top-level
    """
    at_least_one_required={'data', 'errors', 'meta'}
    allowed={"jsonapi", "links", "included"}
    cannot_coexist={"data", "errors"}
    def __setitem__(self, key, value):
        if key == "included" and "data" not in self.keys():
            msg = str(self.__class__.__name__) + " does not allow 'included' member if 'data' member is not present"
            raise AttributeError(msg)
        super(JSONDoc, self).__setitem__(key, value)

json_doc = JSONDoc(
    data={
        "id": 5,
        "type": "movies"
    },
    links={
        "self": "http://url.com"
    }
)
person g.carey    schedule 25.06.2015