Как преобразовать XML в хеш в Rails, где сохраняются пустой массив и значения nil

Когда я преобразовываю XML-структуру в хэш с помощью Hash.from_xml(@xml) в Rails, синтаксический анализатор не различает пустые массивы и нулевые значения, тогда как XML изображает узлы, которые немедленно заканчиваются \, как пустые массивы, например. <audio_languages/> по сравнению с атрибутом nil="true" интерпретируются как нулевые значения.

Структура XML (которую я могу сгенерировать) выглядит следующим образом:

<response>
  <medias>
    <media>
      <id>1</id>
      <name>Media-1</name>
      <audio_languages/>
      <avg_rating nil="true"></avg_rating>
    </media>
    <media>
      <id>2</id>
      <name>Media-2</name>
      <audio_languages/>
      <avg_rating nil="true"></avg_rating>
    </media>
  </medias>
</response>

Ожидаемый результат от Hash.from_xml(@xml) будет следующим:

{"response"=>{"medias"=>{"media"=>[{"id"=>"1", "name"=>"Media-1", "audio_languages"=>[], "avg_rating"=>nil}, {"id"=>"2", "name"=>"Media-2", "audio_languages"=>[], "avg_rating"=>nil}]}}} 

вместо этого я получаю нулевые значения для audio_languages и avg_rating:

{"response"=>{"medias"=>{"media"=>[{"id"=>"1", "name"=>"Media-1", "audio_languages"=>nil, "avg_rating"=>nil}, {"id"=>"2", "name"=>"Media-2", "audio_languages"=>nil, "avg_rating"=>nil}]}}}  

person chinshr    schedule 26.03.2013    source источник


Ответы (1)


В итоге я проанализировал узлы, используя libxml, и я проверяю, имеют ли узлы искомую подпись, чтобы выяснить, хочу ли я преобразовать как пустой массив или нулевое значение.

# Usage: Hash.from_xml_with_libxml(xml)
require 'xml/libxml'
# adapted from 
# http://movesonrails.com/articles/2008/02/25/libxml-for-active-resource-2-0

class Hash 
  class << self
    def from_xml_with_libxml(xml, strict=true) 
      LibXML::XML.default_load_external_dtd = false
      LibXML::XML.default_pedantic_parser   = strict
      result = LibXML::XML::Parser.string(xml).parse 
      return { result.root.name.to_s => xml_node_to_hash_with_libxml(result.root)}
    end 

    def xml_node_to_hash_with_libxml(node) 
      # If we are at the root of the document, start the hash 
      if node.element? 
        if node.children? 
          result_hash = {} 

          node.each_child do |child| 
            result = xml_node_to_hash_with_libxml(child) 

            if child.name == "text"
              if !child.next? and !child.prev?
                return result
              end
            elsif result_hash[child.name]
              if result_hash[child.name].is_a?(Object::Array)
                result_hash[child.name] << result
              else
                result_hash[child.name] = [result_hash[child.name]] << result
              end
            else 
              result_hash[child.name] = result
            end
          end
          return result_hash 
        else 
          # Nodes of sort <audio_languages/>, are arrays, 
          # and nodes like <average_rating "nil"="true"/> are nil values.
          if node.to_s.match(/^\<(.+)\/\>$/) && nil == node.attributes["nil"]
            return []
          end
          return nil 
        end 
      else 
        return node.content.to_s 
      end 
    end          
  end
end
person chinshr    schedule 28.03.2013