Добавление строк документации в namedtuples?

Можно ли простым способом добавить строку документации в namedtuple?

Я пытался

from collections import namedtuple

Point = namedtuple("Point", ["x", "y"])
"""
A point in 2D space
"""

# Yet another test

"""
A(nother) point in 2D space
"""
Point2 = namedtuple("Point2", ["x", "y"])

print Point.__doc__ # -> "Point(x, y)"
print Point2.__doc__ # -> "Point2(x, y)"

но это не мешает. Можно ли как-то по-другому?


person Rickard    schedule 22.10.2009    source источник


Ответы (10)


Этого можно добиться, создав простой пустой класс-оболочку вокруг возвращаемого значения из namedtuple. Содержимое файла, который я создал (nt.py):

from collections import namedtuple

Point_ = namedtuple("Point", ["x", "y"])

class Point(Point_):
    """ A point in 2d space """
    pass

Затем в Python REPL:

>>> print nt.Point.__doc__
 A point in 2d space 

Или вы можете сделать:

>>> help(nt.Point)  # which outputs...
Help on class Point in module nt:

class Point(Point)
 |  A point in 2d space
 |  
 |  Method resolution order:
 |      Point
 |      Point
 |      __builtin__.tuple
 |      __builtin__.object
 ...

Если вам не нравится делать это каждый раз вручную, тривиально написать своего рода фабричную функцию для этого:

def NamedTupleWithDocstring(docstring, *ntargs):
    nt = namedtuple(*ntargs)
    class NT(nt):
        __doc__ = docstring
    return NT

Point3D = NamedTupleWithDocstring("A point in 3d space", "Point3d", ["x", "y", "z"])

p3 = Point3D(1,2,3)

print p3.__doc__

который выводит:

A point in 3d space
person Mark Rushakoff    schedule 22.10.2009
comment
Не превратит ли подкласс namedtuple в полноценный объект? Тем самым теряя часть прироста производительности от именованных кортежей? - person exhuma; 10.08.2017
comment
Если вы добавите __slots__ = () в производный подкласс, вы сможете сохранить преимущества использования памяти и производительности при использовании namedtuple. - person ali_m; 20.10.2017
comment
Это по-прежнему добавляет еще один уровень к MRO, что не оправдано для строки документации. Однако можно просто назначить __doc__ и сохранить настроенную строку документации в исходном объекте. - person Bachsau; 25.09.2019

В Python 3 оболочка не требуется, поскольку атрибуты __doc__ типов доступны для записи.

from collections import namedtuple

Point = namedtuple('Point', 'x y')
Point.__doc__ = '''\
A 2-dimensional coordinate

x - the abscissa
y - the ordinate'''

Это близко соответствует стандартному определению класса, где строка документации следует за заголовком.

class Point():
    '''A 2-dimensional coordinate

    x - the abscissa
    y - the ordinate'''
    <class code>

Это не работает в Python 2.

AttributeError: attribute '__doc__' of 'type' objects is not writable.

person Terry Jan Reedy    schedule 04.12.2013

Наткнулся на этот старый вопрос через Google, задаваясь вопросом о том же.

Просто хотел отметить, что вы можете еще больше привести его в порядок, вызвав namedtuple() прямо из объявления класса:

from collections import namedtuple

class Point(namedtuple('Point', 'x y')):
    """Here is the docstring."""
person CoupleWavyLines    schedule 27.03.2013
comment
Важно, чтобы вы включили __slots__ = () в класс. В противном случае вы создаете __dict__ для своих атрибутов, теряя легковесность namedtuple. - person BoltzmannBrain; 02.06.2017

Можно ли простым способом добавить строку документации в namedtuple?

Да, несколькими способами.

Типирование подкласса.NamedTuple — Python 3.6+

Начиная с Python 3.6 мы можем использовать определение class напрямую с typing.NamedTuple, со строкой документации (и аннотациями!):

from typing import NamedTuple

class Card(NamedTuple):
    """This is a card type."""
    suit: str
    rank: str

По сравнению с Python 2 объявление пустого __slots__ не требуется. В Python 3.8 в этом нет необходимости даже для подклассов.

Обратите внимание, что объявление __slots__ не может быть непустым!

В Python 3 вы также можете легко изменить документ для namedtuple:

NT = collections.namedtuple('NT', 'foo bar')

NT.__doc__ = """:param str foo: foo name
:param list bar: List of bars to bar"""

Что позволяет нам просматривать их намерения, когда мы вызываем для них помощь:

Help on class NT in module __main__:

class NT(builtins.tuple)
 |  :param str foo: foo name
 |  :param list bar: List of bars to bar
...

Это действительно просто по сравнению с трудностями, с которыми мы сталкиваемся при выполнении того же самого в Python 2.

Питон 2

В Python 2 вам нужно

  • подкласс namedtuple, и
  • объявить __slots__ == ()

Объявление __slots__ является важной частью, которую пропускают другие ответы здесь.

Если вы не объявите __slots__, вы можете добавить к экземплярам изменяемые специальные атрибуты, что приведет к ошибкам.

class Foo(namedtuple('Foo', 'bar')):
    """no __slots__ = ()!!!"""

И сейчас:

>>> f = Foo('bar')
>>> f.bar
'bar'
>>> f.baz = 'what?'
>>> f.__dict__
{'baz': 'what?'}

Каждый экземпляр будет создавать отдельный __dict__ при доступе к __dict__ (отсутствие __slots__ в противном случае не будет препятствовать функциональности, но легкость кортежа, неизменность и объявленные атрибуты — все это важные особенности namedtuples).

Вам также понадобится __repr__, если вы хотите, чтобы то, что отображается в командной строке, давало вам эквивалентный объект:

NTBase = collections.namedtuple('NTBase', 'foo bar')

class NT(NTBase):
    """
    Individual foo bar, a namedtuple

    :param str foo: foo name
    :param list bar: List of bars to bar
    """
    __slots__ = ()

такой __repr__ необходим, если вы создаете базовый namedtuple с другим именем (как мы сделали выше с аргументом строки имени, 'NTBase'):

    def __repr__(self):
        return 'NT(foo={0}, bar={1})'.format(
                repr(self.foo), repr(self.bar))

Чтобы проверить представление, создайте экземпляр, а затем проверьте равенство прохода к eval(repr(instance))

nt = NT('foo', 'bar')
assert eval(repr(nt)) == nt

Пример из документации

документы также приведите такой пример относительно __slots__ - я добавляю к нему свою собственную строку документации:

class Point(namedtuple('Point', 'x y')):
    """Docstring added here, not in original"""
    __slots__ = ()
    @property
    def hypot(self):
        return (self.x ** 2 + self.y ** 2) ** 0.5
    def __str__(self):
        return 'Point: x=%6.3f  y=%6.3f  hypot=%6.3f' % (self.x, self.y, self.hypot)

...

Показанный выше подкласс устанавливает __slots__ в пустой кортеж. Это помогает поддерживать низкие требования к памяти, предотвращая создание словарей экземпляров.

Это демонстрирует использование на месте (как предлагает другой ответ здесь), но обратите внимание, что использование на месте может сбивать с толку, когда вы смотрите на порядок разрешения метода, если вы отлаживаете, поэтому я первоначально предложил использовать Base в качестве суффикс для основания namedtuple:

>>> Point.mro()
[<class '__main__.Point'>, <class '__main__.Point'>, <type 'tuple'>, <type 'object'>]
                # ^^^^^---------------------^^^^^-- same names!        

Чтобы предотвратить создание __dict__ при создании подкласса из класса, который его использует, вы также должны объявить его в подклассе. См. также этот ответ, чтобы узнать больше об использовании __slots__.

person Aaron Hall    schedule 17.02.2015
comment
Хотя это не так кратко и ясно, как другие ответы, это должен быть принятый ответ, потому что он подчеркивает важность __slots__. Без этого вы теряете облегченное значение namedtuple. - person BoltzmannBrain; 02.06.2017

Начиная с Python 3.5, строки документации для namedtuple объектов можно обновлять.

Из что нового:

Point = namedtuple('Point', ['x', 'y'])
Point.__doc__ += ': Cartesian coodinate'
Point.x.__doc__ = 'abscissa'
Point.y.__doc__ = 'ordinate'
person vishes_shell    schedule 04.09.2016

В Python 3.6+ вы можете использовать:

class Point(NamedTuple):
    """
    A point in 2D space
    """
    x: float
    y: float
person Docent    schedule 07.03.2018
comment
Я получаю NameError: имя «NamedTuple» не определено - person nbedou; 06.07.2018
comment
@nbedou docs.python.org/3/library/typing.html# ввод.NamedTuple - person nodakai; 03.10.2018

Нет необходимости использовать класс-оболочку, как это предлагается в принятом ответе. Просто буквально добавьте строку документации:

from collections import namedtuple

Point = namedtuple("Point", ["x", "y"])
Point.__doc__="A point in 2D space"

В результате получается: (пример с использованием ipython3):

In [1]: Point?
Type:       type
String Form:<class '__main__.Point'>
Docstring:  A point in 2D space

In [2]: 

Вуаля!

person A Sz    schedule 24.09.2014
comment
Примечание. Это действительно только для Python 3. В Python 2: AttributeError: attribute '__doc__' of 'type' objects is not writable. - person Taylor Edmiston; 28.03.2015

Вы можете придумать собственную версию функции фабрики namedtuple от Рэймонда. Hettinger и добавьте необязательный аргумент docstring. Однако было бы проще — и, возможно, лучше — просто определить свою собственную фабричную функцию, используя ту же базовую технику, что и в рецепте. В любом случае вы получите что-то многоразовое.

from collections import namedtuple

def my_namedtuple(typename, field_names, verbose=False,
                 rename=False, docstring=''):
    '''Returns a new subclass of namedtuple with the supplied
       docstring appended to the default one.

    >>> Point = my_namedtuple('Point', 'x, y', docstring='A point in 2D space')
    >>> print Point.__doc__
    Point(x, y):  A point in 2D space
    '''
    # create a base class and concatenate its docstring and the one passed
    _base = namedtuple(typename, field_names, verbose, rename)
    _docstring = ''.join([_base.__doc__, ':  ', docstring])

    # fill in template to create a no-op subclass with the combined docstring
    template = '''class subclass(_base):
        %(_docstring)r
        pass\n''' % locals()

    # execute code string in a temporary namespace
    namespace = dict(_base=_base, _docstring=_docstring)
    try:
        exec template in namespace
    except SyntaxError, e:
        raise SyntaxError(e.message + ':\n' + template)

    return namespace['subclass']  # subclass object created
person martineau    schedule 28.07.2010

Я создал эту функцию, чтобы быстро создать именованный кортеж и задокументировать кортеж вместе с каждым из его параметров:

from collections import namedtuple


def named_tuple(name, description='', **kwargs):
    """
    A named tuple with docstring documentation of each of its parameters
    :param str name: The named tuple's name
    :param str description: The named tuple's description
    :param kwargs: This named tuple's parameters' data with two different ways to describe said parameters. Format:
        <pre>{
            str: ( # The parameter's name
                str, # The parameter's type
                str # The parameter's description
            ),
            str: str, # The parameter's name: the parameter's description
            ... # Any other parameters
        }</pre>
    :return: collections.namedtuple
    """
    parameter_names = list(kwargs.keys())

    result = namedtuple(name, ' '.join(parameter_names))

    # If there are any parameters provided (such that this is not an empty named tuple)
    if len(parameter_names):
        # Add line spacing before describing this named tuple's parameters
        if description is not '':
            description += "\n"

        # Go through each parameter provided and add it to the named tuple's docstring description
        for parameter_name in parameter_names:
            parameter_data = kwargs[parameter_name]

            # Determine whether parameter type is included along with the description or
            # if only a description was provided
            parameter_type = ''
            if isinstance(parameter_data, str):
                parameter_description = parameter_data
            else:
                parameter_type, parameter_description = parameter_data

            description += "\n:param {type}{name}: {description}".format(
                type=parameter_type + ' ' if parameter_type else '',
                name=parameter_name,
                description=parameter_description
            )

            # Change the docstring specific to this parameter
            getattr(result, parameter_name).__doc__ = parameter_description

    # Set the docstring description for the resulting named tuple
    result.__doc__ = description

    return result

Затем вы можете создать новый именованный кортеж:

MyTuple = named_tuple(
    "MyTuple",
    "My named tuple for x,y coordinates",
    x="The x value",
    y="The y value"
)

Затем создайте экземпляр описанного именованного кортежа с вашими данными, т.е.

t = MyTuple(4, 8)
print(t) # prints: MyTuple(x=4, y=8)

При выполнении help(MyTuple) через командную строку python3 отображается следующее:

Help on class MyTuple:

class MyTuple(builtins.tuple)
 |  MyTuple(x, y)
 |
 |  My named tuple for x,y coordinates
 |
 |  :param x: The x value
 |  :param y: The y value
 |
 |  Method resolution order:
 |      MyTuple
 |      builtins.tuple
 |      builtins.object
 |
 |  Methods defined here:
 |
 |  __getnewargs__(self)
 |      Return self as a plain tuple.  Used by copy and pickle.
 |
 |  __repr__(self)
 |      Return a nicely formatted representation string
 |
 |  _asdict(self)
 |      Return a new OrderedDict which maps field names to their values.
 |
 |  _replace(_self, **kwds)
 |      Return a new MyTuple object replacing specified fields with new values
 |
 |  ----------------------------------------------------------------------
 |  Class methods defined here:
 |
 |  _make(iterable) from builtins.type
 |      Make a new MyTuple object from a sequence or iterable
 |
 |  ----------------------------------------------------------------------
 |  Static methods defined here:
 |
 |  __new__(_cls, x, y)
 |      Create new instance of MyTuple(x, y)
 |
 |  ----------------------------------------------------------------------
 |  Data descriptors defined here:
 |
 |  x
 |      The x value
 |
 |  y
 |      The y value
 |
 |  ----------------------------------------------------------------------
 |  Data and other attributes defined here:
 |  
 |  _fields = ('x', 'y')
 |  
 |  _fields_defaults = {}
 |  
 |  ----------------------------------------------------------------------
 |  Methods inherited from builtins.tuple:
 |  
 |  __add__(self, value, /)
 |      Return self+value.
 |  
 |  __contains__(self, key, /)
 |      Return key in self.
 |  
 |  __eq__(self, value, /)
 |      Return self==value.
 |  
 |  __ge__(self, value, /)
 |      Return self>=value.
 |  
 |  __getattribute__(self, name, /)
 |      Return getattr(self, name).
 |  
 |  __getitem__(self, key, /)
 |      Return self[key].
 |  
 |  __gt__(self, value, /)
 |      Return self>value.
 |  
 |  __hash__(self, /)
 |      Return hash(self).
 |  
 |  __iter__(self, /)
 |      Implement iter(self).
 |  
 |  __le__(self, value, /)
 |      Return self<=value.
 |  
 |  __len__(self, /)
 |      Return len(self).
 |  
 |  __lt__(self, value, /)
 |      Return self<value.
 |  
 |  __mul__(self, value, /)
 |      Return self*value.
 |  
 |  __ne__(self, value, /)
 |      Return self!=value.
 |  
 |  __rmul__(self, value, /)
 |      Return value*self.
 |  
 |  count(self, value, /)
 |      Return number of occurrences of value.
 |  
 |  index(self, value, start=0, stop=9223372036854775807, /)
 |      Return first index of value.
 |      
 |      Raises ValueError if the value is not present.

Кроме того, вы также можете указать тип параметра с помощью:

MyTuple = named_tuple(
    "MyTuple",
    "My named tuple for x,y coordinates",
    x=("int", "The x value"),
    y=("int", "The y value")
)
person Steven    schedule 07.01.2019

Нет, вы можете добавлять строки документов только в модули, классы и функции (включая методы)

person Jeffrey Aylesworth    schedule 22.10.2009