<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
		>
<channel>
	<title>Kommentare zu: Meik Michalke: Weniger Downloads != mehr CD-Verkäufe</title>
	<atom:link href="http://www.horstseinefreunde.de/musik/meik-michalke-weniger-downloads-mehr-cd-verkaufe/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.horstseinefreunde.de/musik/meik-michalke-weniger-downloads-mehr-cd-verkaufe/</link>
	<description></description>
	<lastBuildDate>Sun, 18 Dec 2011 21:37:22 +0000</lastBuildDate>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=abc</generator>
	<item>
		<title>Von: m.eik</title>
		<link>http://www.horstseinefreunde.de/musik/meik-michalke-weniger-downloads-mehr-cd-verkaufe/comment-page-1/#comment-4</link>
		<dc:creator>m.eik</dc:creator>
		<pubDate>Sun, 12 Sep 2010 14:56:38 +0000</pubDate>
		<guid isPermaLink="false">http://horstseinefreunde.de/?p=76#comment-4</guid>
		<description>hi,

&quot;Korrelationen berechnet man nicht nur anhand von Mittelwerten, sondern man braucht dafür schon alle Werte.&quot;

das ist so auch nicht ganz sauber, denn in die korrelationen sind gar keine mittelwerte eingegangen, sondern die jeweiligen jahressummen. es wurden also jedes jahr insgesamt etwa 150 mio. CD-alben verkauft -- das ist kein mittelwert, insofern gibt es für diese einzelwerte keine streuung. was sollen denn &quot;alle werte&quot; sein? korrekt gesehen handelt es sich um sieben meßzeitpunkte (von 2003 bis 2009), die in die analyse eingingen, und daran ist eigentlich nichts anrüchig. wenn man den zusammenhang von sonnentagen und einkommen berechnen wollte, könnte man auch die monatssummen über ein jahr heranziehen. man hat dabei natürlich weniger information als wenn man etwa wöchentlich oder täglich messen würde, was im endeffekt aber nur zur konsequenz haben dürfte, daß ein zusammenhang auf monatsebene übersehen werden kann. ich behaupte schließlich nicht, daß es im frühling andere effekte gibt als im herbst, oder daß die auswirkungen von filesharing nachts andere sind als am tag.

bemängeln kann man in der tat, daß es recht wenige daten sind, aber dafür kann ich nichts ;-) es ist daher aber umso bemerkenswerter, daß einige zusammenhänge dennoch statistisch bedeutsam ausfallen, denn zu wenige daten bergen eher das risiko, effekte zu übersehen, nicht fälschlich welche zu finden. im falle der nullkorrelation halte ich es aber für völlig irrelevant, da die CD-verkäufe mit ein wenig toleranz als konstante angesehen werden können. eine konstante hat keine varianz, daher kann man mit ihr korrelieren was man will, es kann niemals ein zusammenhang herauskommen (ohne varianz wird auch kovarianz ziemlich schwierig). daraus kann man ableiten, daß die verkäufe von CD-alben mit überhaupt *gar* nichts korrelieren können, und das schließt illegale downloads natürlich mit ein.

&quot;signifikanz&quot; bedeutet lediglich, daß ein gefundener zusammenhang sehr wahrscheinlich (nach konvention &gt;95% bzw. &gt;99%) nicht durch reinen zufall zu erklären ist. wenn die o.g. korrelationen signifikant ausfallen, dann sind sie eben sehr wahrscheinlich nicht zufällig. das kann bei wenigen meßzeitpunkten daran liegen, daß die effekte sehr groß sind und deshalb schon nach wenigen messungen überzufällig erscheinen. das ist ja der grund, warum man normalerweise vor einer untersuchung eine power-analyse macht -- wenn ich von kleinen effekten ausgehe, brauche ich mehr messungen, um sie trotzdem erkennen zu konnen; rechne ich mit großen effekten, reichen weniger daten. die größe eines effekts ist am ende meistens auch interessanter als das signifikanzniveau, und korrealtionskoeffizienten lassen sich als effektstärkemaß interpretieren, insofern sind korrelationen über die grafik hinaus schon eine sehr nützliche information.

ich habe auch darauf hingewiesen, daß korrelationen nicht ursächlich interpretiert werden dürfen. den vorwurf der &quot;pseudowissenschaftlichkeit&quot; möchte ich auf jeden fall zurückweisen.

ich habe die folien im blog noch etwas kommentiert ( http://reaktanz.de/blog/?e=110 ) und auf der a2n eine ergänzung hinzugefügt ( http://reaktanz.de/blog/?e=118 ).</description>
		<content:encoded><![CDATA[<p>hi,</p>
<p>&#8220;Korrelationen berechnet man nicht nur anhand von Mittelwerten, sondern man braucht dafür schon alle Werte.&#8221;</p>
<p>das ist so auch nicht ganz sauber, denn in die korrelationen sind gar keine mittelwerte eingegangen, sondern die jeweiligen jahressummen. es wurden also jedes jahr insgesamt etwa 150 mio. CD-alben verkauft &#8212; das ist kein mittelwert, insofern gibt es für diese einzelwerte keine streuung. was sollen denn &#8220;alle werte&#8221; sein? korrekt gesehen handelt es sich um sieben meßzeitpunkte (von 2003 bis 2009), die in die analyse eingingen, und daran ist eigentlich nichts anrüchig. wenn man den zusammenhang von sonnentagen und einkommen berechnen wollte, könnte man auch die monatssummen über ein jahr heranziehen. man hat dabei natürlich weniger information als wenn man etwa wöchentlich oder täglich messen würde, was im endeffekt aber nur zur konsequenz haben dürfte, daß ein zusammenhang auf monatsebene übersehen werden kann. ich behaupte schließlich nicht, daß es im frühling andere effekte gibt als im herbst, oder daß die auswirkungen von filesharing nachts andere sind als am tag.</p>
<p>bemängeln kann man in der tat, daß es recht wenige daten sind, aber dafür kann ich nichts <img src='http://www.horstseinefreunde.de/wp-includes/images/smilies/icon_wink.gif' alt=';-)' class='wp-smiley' />  es ist daher aber umso bemerkenswerter, daß einige zusammenhänge dennoch statistisch bedeutsam ausfallen, denn zu wenige daten bergen eher das risiko, effekte zu übersehen, nicht fälschlich welche zu finden. im falle der nullkorrelation halte ich es aber für völlig irrelevant, da die CD-verkäufe mit ein wenig toleranz als konstante angesehen werden können. eine konstante hat keine varianz, daher kann man mit ihr korrelieren was man will, es kann niemals ein zusammenhang herauskommen (ohne varianz wird auch kovarianz ziemlich schwierig). daraus kann man ableiten, daß die verkäufe von CD-alben mit überhaupt *gar* nichts korrelieren können, und das schließt illegale downloads natürlich mit ein.</p>
<p>&#8220;signifikanz&#8221; bedeutet lediglich, daß ein gefundener zusammenhang sehr wahrscheinlich (nach konvention &gt;95% bzw. &gt;99%) nicht durch reinen zufall zu erklären ist. wenn die o.g. korrelationen signifikant ausfallen, dann sind sie eben sehr wahrscheinlich nicht zufällig. das kann bei wenigen meßzeitpunkten daran liegen, daß die effekte sehr groß sind und deshalb schon nach wenigen messungen überzufällig erscheinen. das ist ja der grund, warum man normalerweise vor einer untersuchung eine power-analyse macht &#8212; wenn ich von kleinen effekten ausgehe, brauche ich mehr messungen, um sie trotzdem erkennen zu konnen; rechne ich mit großen effekten, reichen weniger daten. die größe eines effekts ist am ende meistens auch interessanter als das signifikanzniveau, und korrealtionskoeffizienten lassen sich als effektstärkemaß interpretieren, insofern sind korrelationen über die grafik hinaus schon eine sehr nützliche information.</p>
<p>ich habe auch darauf hingewiesen, daß korrelationen nicht ursächlich interpretiert werden dürfen. den vorwurf der &#8220;pseudowissenschaftlichkeit&#8221; möchte ich auf jeden fall zurückweisen.</p>
<p>ich habe die folien im blog noch etwas kommentiert ( <a href="http://reaktanz.de/blog/?e=110" rel="nofollow">http://reaktanz.de/blog/?e=110</a> ) und auf der a2n eine ergänzung hinzugefügt ( <a href="http://reaktanz.de/blog/?e=118" rel="nofollow">http://reaktanz.de/blog/?e=118</a> ).</p>
]]></content:encoded>
	</item>
</channel>
</rss>

