XSLT 1.0 для перебора нескольких элементов XML со значениями, разделенными запятыми.

У меня есть XML-документ, структурированный следующим образом

<items>
 <item>
  <name>item1</name>
  <attributes>a,b,c,d</attributes>
 </item>
 <item>
  <name>item2</name>
  <attributes>c,d,e</attributes>
 </item>
</items>

Для каждого уникального значения атрибута (разделенного запятыми) мне нужно перечислить все имена элементов, связанные с этим значением, например:

a : item1
b : item1
c : item1, item2
d : item1, item2
e : item2

Мой первоначальный план состоял в том, чтобы использовать шаблон для разбора атрибутов на узлы атрибутов, окружая каждый соответствующими тегами, а затем разделяя уникальные значения с помощью выражения XPATH, например

Attribute[not(.=following::Attribute)]

но поскольку результат шаблона не является набором узлов, который когда-либо проходил через синтаксический анализатор XML, я не могу его пройти. Я также попробовал функцию exslt node-set () только для того, чтобы понять, что она также не позволяет мне перемещаться по отдельным узлам атрибутов.

На данный момент я не могу найти простой способ сделать это и был бы очень признателен за любую помощь или идеи о том, как действовать дальше. Спасибо!


person ratherOCD    schedule 06.04.2011    source источник
comment
Хороший вопрос, +1. См. Мой ответ для полного решения и объяснения.   -  person Dimitre Novatchev    schedule 06.04.2011
comment
Мне понравилось думать об этом вопросе   -  person Wayne    schedule 06.04.2011


Ответы (2)


Это преобразование:

<xsl:stylesheet version="1.0"
 xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
 xmlns:msxsl="urn:schemas-microsoft-com:xslt"
 xmlns:ext="http://exslt.org/common">
 <xsl:output omit-xml-declaration="yes" indent="yes"/>

 <xsl:key name="kAtrByVal" match="attr" use="."/>

 <xsl:template match="/">
  <xsl:variable name="vrtfPass1">
   <groups>
    <xsl:apply-templates/>
   </groups>
  </xsl:variable>

  <xsl:variable name="vPass1"
       select="ext:node-set($vrtfPass1)"/>

  <xsl:apply-templates select="$vPass1/*"/>
 </xsl:template>

 <xsl:template match="item">
  <group name="{name}">
   <xsl:apply-templates select="attributes"/>
  </group>
 </xsl:template>

 <xsl:template match="attributes" name="tokenize">
  <xsl:param name="pText" select="."/>

  <xsl:if test="string-length($pText)">
   <xsl:variable name="vText" select=
        "concat($pText,',')"/>
   <attr>
    <xsl:value-of select="substring-before($vText,',')"/>
   </attr>
   <xsl:call-template name="tokenize">
    <xsl:with-param name="pText" select=
    "substring-after($pText,',')"/>
   </xsl:call-template>
  </xsl:if>
 </xsl:template>

 <xsl:template match=
  "attr[generate-id()
       =
        generate-id(key('kAtrByVal',.)[1])
       ]
  ">
  <xsl:value-of select="concat('&#xA;',.,': ')"/>

  <xsl:for-each select="key('kAtrByVal',.)">
   <xsl:value-of select="../@name"/>
   <xsl:if test="not(position()=last())">
    <xsl:text>, </xsl:text>
   </xsl:if>
  </xsl:for-each>
 </xsl:template>

 <xsl:template match="text()"/>
</xsl:stylesheet>

при применении к предоставленному XML-документу:

<items>
    <item>
        <name>item1</name>
        <attributes>a,b,c,d</attributes>
    </item>
    <item>
        <name>item2</name>
        <attributes>c,d,e</attributes>
    </item>
</items>

дает желаемый правильный результат:

a: item1
b: item1
c: item1, item2
d: item1, item2
e: item2

Объяснение:

  1. Pass1: токенизация и конечный результат:

<groups>
  <group name="item1">
    <attr>a</attr>
    <attr>b</attr>
    <attr>c</attr>
    <attr>d</attr>
  </group>
  <group name="item2">
    <attr>c</attr>
    <attr>d</attr>
    <attr>e</attr>
  </group>
</groups>

.2. Pass2 принимает результат Pass1 (преобразованный в набор узлов с использованием функции расширения ext:node-set()) в качестве входных данных, выполняет мюнхианскую группировку и выдает окончательный желаемый результат.

person Dimitre Novatchev    schedule 06.04.2011
comment
По-прежнему возникают небольшие проблемы с этим. Используется ли <xsl:template match="text()"/> для того, чтобы при вызове <xsl:apply-templates select="$vPass1/*"/> шаблон группировки Мюнчи мог делать свое дело? - person ratherOCD; 06.04.2011
comment
@ratherOCD: Нет, этот шаблон просто переопределяет встроенный шаблон XSLT для текстовых узлов и гарантирует, что текстовые узлы не будут выводиться в результате <xsl:apply-templates/> - person Dimitre Novatchev; 06.04.2011
comment
Спасибо, все заработало. Есть ли хороший способ отсортировать атрибуты по алфавиту? - person ratherOCD; 06.04.2011
comment
@ratherOCD: Да, заменить xsl:apply-templates select="$vPass1/*/> на <xsl:apply-templates select="$vPass1/*/*/attr"> <xsl:sort/> </xsl:apply-templates> - person Dimitre Novatchev; 06.04.2011

Моя первая мысль - сделать два прохода. Сначала токенизируйте элементы attributes, используя (слегка) измененную версию @ Ответ Алехандро на этот предыдущий вопрос:

<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
    <xsl:template match="/">
        <items>
            <xsl:apply-templates/>
        </items>
    </xsl:template>
    <xsl:template match="item">
        <item name="{name}">
            <xsl:apply-templates select="attributes"/>
        </item>
    </xsl:template>
    <xsl:template match="attributes" name="tokenize">
        <xsl:param name="text" select="."/>
        <xsl:param name="separator" select="','"/>
        <xsl:choose>
            <xsl:when test="not(contains($text, $separator))">
                <val>
                    <xsl:value-of select="normalize-space($text)"/>
                </val>
            </xsl:when>
            <xsl:otherwise>
                <val>
                    <xsl:value-of select="normalize-space(
                        substring-before($text, $separator))"/>
                </val>
                <xsl:call-template name="tokenize">
                    <xsl:with-param name="text" select="substring-after(
                                    $text, $separator)"/>
                </xsl:call-template>
            </xsl:otherwise>
        </xsl:choose>
    </xsl:template>

Which produces:

<items>
    <item name="item1">
        <val>a</val>
        <val>b</val>
        <val>c</val>
        <val>d</val>
    </item>
    <item name="item2">
        <val>c</val>
        <val>d</val>
        <val>e</val>
    </item>
</items>

Затем примените к этому выводу следующую таблицу стилей:

<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
    <xsl:output method="text"/>
    <xsl:strip-space elements="*"/>
    <xsl:key name="byVal" match="val" use="." />
    <xsl:template match="val[generate-id() = 
                             generate-id(key('byVal', .)[1])]">
        <xsl:value-of select="." />
        <xsl:text> : </xsl:text>
        <xsl:apply-templates select="key('byVal', .)" mode="group" />
        <xsl:text>&#10;</xsl:text>
    </xsl:template>
    <xsl:template match="val" mode="group">
        <xsl:value-of select="../@name" />
        <xsl:if test="position() != last()">
            <xsl:text>, </xsl:text>
        </xsl:if> 
    </xsl:template>
    <xsl:template match="val" />
</xsl:stylesheet>

Производство:

a : item1
b : item1
c : item1, item2
d : item1, item2
e : item2

Выполнение этого в одной таблице стилей потребует дополнительных размышлений (или функции расширения).

person Wayne    schedule 06.04.2011