Numberland - New Processes, New Materials

GermanAfrikaansArabicBelarusianBulgarianChinese (Simplified)CzechDanishDutchEnglishEstonianFilipinoFinnishFrenchGreekHebrewHindiHungarianIndonesianItalianJapaneseKoreanLatvianLithuanianMalayNorwegianPersianPolishPortugueseRussianSlovakSpanishSwedishThaiTurkishVietnamese
  • Wer wir sind

    Wir sind - seit 1996 - als Ingenieurbüro auf dem Werkstoffsektor aktiv. Dabei verbinden wir Themen wie Innovations- Wissens- und Technologiemanagement mit sehr guten Kontakten zu Wissenschaft und Wirtschaft ...
    +Read More
  • Your man in Germany

                Your man in Germany Need a partner in Germany to get in contact with German institutions or companies? Are you tired of long distance phone calls or expensive trips from abroad with no or little results? Read more ...
    +Read More
  • Neue Werkstoffe

    Wir übersetzen technische Anforderungen in physikalische Effekte oder Eigenschaften, und finden dann den dazu passenden Werkstoff ... We translate technical demands intophysical effects or properties, andthen find the suitable material ...    
    +Read More
  • Neue Prozesse

    Wir analysieren, optimieren und dokumentieren Prozesse, die oft nicht im QM-Handbuch stehen,und bringen ihnen das Laufen bei ... We analyse, optimize and document processesoften not covered by quality management handbooks, and teach them to run ...
    +Read More
  • Leistungen

    Wir finden neue Werkstoffe, Bauteile, Herstellungs- und Analytikverfahren, Projektpartner, Entwickler oder Forschungseinrichtungen, Know-how oder Geräte, etc. Damit all diese neuen Erkenntnisse dann bei Ihnen auch effektiv eingesetzt werden können, helfen wir Ihnen, Ihr Wissen besser zu erfassen, Prozesse zu optimieren, F&E-Projekte durchzuführen, technische Angebote zu beurteilen oder Lastenhefte zu erstellen.  
    +Read More
  • 1
  • 2
  • 3
  • 4
  • 5

NumberlandTechnologyNews available in English und auf Deutsch

Publish Offers and Requests for free

This month offers and requests from the materials sector

We publish your materials conference

State of the Art over Night / Über Nacht zum Stand der Technik

 

Using a feature matrix it is possible to determine the significance of a topic for a selected document (this technique is different to that know as "Search Eingine Optimization - SEO", because only the clean text is analyzed without considering text attributes (headlines, page names, picture text, etc.). To obtain a result one has to calculate word freuencies which can be done in different ways.

It is cumbersome however to determine topic importance not only for a single document, but for a collection. Basically this can be achieved with procedures like that shown in figure 7 (one has to visualize word frequency for each document in the collection); but it is hard to concurrently show the significance of several topics for a whole document collection.

In these cases network diagrams are a possible solution. Topics as well as documents are shown as points, connected by lines. Line lenght is a measure of thematic proximity. Shorter lines thus mean higher proximity (and therefore also a higher word frequency). Topics and documents a spread over the plane of projection in a kind that thematic distance of topics to certain documents can be found out easily. Figure 4a shows an example with three topics and about 850 documents (patents in this case). Topics are sized corresponding to their importance for the collection as a whole.
Mit Hilfe der Eingenschaftsmatrix ist es möglich, zu ermitteln, wie wichtig ein bestimmtes Thema für ein ausgewähltes Dokument ist (das Verfahren dazu läuft anders als das, was üblicherweise unter dem Begriff Suchmaschinenoptimierung (Search Engine Optimization - SEO) verstanden wird, weil in diesem Fall der reine Text analysiert wird, ohne dass Textattribute wie z. B. Überschriften, Seitennamen, Bildunterschriften, etc. berücksichtigt werden). Man berechnet - in unterschiedlicher Weise, das Verhältnis von Worthäufigkeit zu Artikellänge, um die Bedeutung eines Wortes für den Artikel zu erfahren.

Will man diese Information nicht für ein Dokument, sondern für eine Dokumentkollektion erfahren, ist dies im Prinzip mit Darstellungen wie in Bild 7 möglich: man zeigt die Häufigkeit eines ausgewählten Wortes für jedes einzelne Dokument der Kollektion. Schwieriger wird es jedoch, wenn die Bedeutung mehrerer Begriffe für viele Dokumente übersichtlich darzugestellt ist.

Abhilfe schafft in solchen Fällen ein Netzwekdiagramm. Sowohl Dokumente, als auch Themen sind als Punkte dargestellt, die durch Linien verbunden werden. Die Länge der Linie ist dabei ein Maß für die thematische Nähe. Kürzere Linien bedeuten also größere Nähe, und damit einen höheren Wert für die Worthäufigkeit in der Eigenschaftsmatrix. Die Punkte der Dokumente und Themen werden dabei so auf der Zeichenfläche verteilt, dass die "Entfernung" der Themen von einem bestimmten Dokument auf einen Blick ersichtlich ist. Bild 4a zeigt ein Beispiel mit drei Themen, und ca. 850 Dokumenten. Themenpunkte sind - entsprechend ihrer Bedeutung für die Dokumentkollektion - in passender Größe gezeigt.

 

 DocumentAnalysis-04a

 

Figure 4a: network diagram showing thematic distance of about 850 patents to three topics (for explanation see text)Bild 4a: Netzwerkdiagramm zur Darstellung der thematischen Entfernung von ca. 850 Patenten zu drei Themen (weitere Erklärung im Text).

 

Figure 4b shows the same document collection, however with 20 topicsBild 4b zeigt die gleiche Dokumentkollektion, diesmal jedoch mit 20 Themen.

 

 DocumentAnalysis-04b

 

Figure 4b: as figure 4a, however with 20 topicsBild 4b: wie Bild 4a, jedoch mit 20 Themen

 

Figure 4c a detail view of figure 4b, showing not only topic labels but also document labelsBild 4c zeigt einen Ausschnitt aus 4b, in dem nicht nur die Beschriftungen der Themen, sondern ebenso die Beschriftungen der Dokumente sichtbar werden.

 

 DocumentAnalysis-04c

 

Figure 4c: detail view of figure 4bBild 4c: Ausschnitt aus Bild 4b