Praxiswissen auf den Punkt gebracht.
logo
  • Meine Produkte
    Bitte melden Sie sich an, um Ihre Produkte zu sehen.
Menu Menu
MyIww MyIww
  • 25.09.2025 · IWW-Abrufnummer 250345

    Bundesfinanzhof: Urteil vom 18.06.2025 – X R 19/21

    1. Werden in einem Betrieb vorwiegend Bargeschäfte getätigt, können Mängel der Kassenführung der gesamten Buchführung die Ordnungsmäßigkeit nehmen, mit der Folge, dass Finanzamt (FA) und Finanzgericht (FG) dem Grunde nach zur Schätzung befugt sind.

    2. FA und FG sind in der Wahl ihrer Schätzungsmethoden grundsätzlich frei. Jedoch ist diese Freiheit bei mehreren in Betracht kommenden Schätzungsmethoden nach den allgemeinen für die Ausübung pflichtgemäßen Ermessens ( § 5 der Abgabenordnung ) geltenden Grundsätzen eingeschränkt.

    3. Im Rahmen der Ermessensausübung sind tendenziell ungenauere Schätzungsmethoden gegenüber genaueren Schätzungsmethoden nachrangig. In der Regel ist der innere Betriebsvergleich im Verhältnis zum äußeren Betriebsvergleich als die zuverlässigere Schätzungsmethode anzusehen.

    4. FA und FG müssen das Ergebnis ihrer Schätzung nachvollziehbar begründen. Eine fehlende oder nicht nachvollziehbare Begründung kann zu einem sachlich-rechtlichen Mangel des Urteils führen, der auch ohne besondere Rüge vom Revisionsgericht beanstandet werden kann.

    5. Die Finanzverwaltung darf zur Ermittlung von Vergleichsdaten Datenbanken aufbauen und verwenden, auch wenn diese nicht allgemein zugänglich sind, und es ist zulässig, Vergleichsdaten mit Hilfe von Datenbanken zu ermitteln. Allerdings muss die im Einzelfall zu verwendende Datenbank Mindestanforderungen an die Qualität der Datenerfassung erfüllen. Die Gerichte können deshalb gehalten sein, Rückfragen über die Zusammenstellung und Ableitung der anonymisierten Vergleichsdaten zu stellen. Können solche Fragen aus Gründen des Steuergeheimnisses oder aus anderen Gründen nicht beantwortet werden, geht dies zu Lasten des Beweiswertes der Vergleichsdaten (Anschluss an Urteil des Bundesfinanzhofs vom 17.10.2001 - I R 103/00 , BFHE 197, 68, BStBl II 2004, 171, unter III.A.2.c cc).

    6. Es bestehen gegenwärtig erhebliche Zweifel, ob die amtliche Richtsatzsammlung in ihrer bisherigen Form eine geeignete Grundlage für einen äußeren Betriebsvergleich darstellt.


    Tenor:

    Auf die Revision des Klägers wird das Urteil des Finanzgerichts Hamburg vom 13.10.2020 - 2 K 218/18 aufgehoben.

    Die Sache wird an das Finanzgericht Hamburg zur anderweitigen Verhandlung und Entscheidung zurückverwiesen.

    Diesem wird die Entscheidung über die Kosten des Verfahrens übertragen.

    Gründe

    I.

    1

    Die Sache befindet sich im zweiten Rechtsgang.

    2

    Der Kläger und Revisionskläger (Kläger) betrieb in den Streitjahren 2013 und 2014 in Hamburg eine Diskothek. Seinen Gewinn ermittelte er durch Betriebsvermögensvergleich.

    3

    Im Rahmen einer Außenprüfung beanstandete der Beklagte und Revisionsbeklagte (Finanzamt --FA--) die Kassen- und Buchführung des Klägers als formell ordnungswidrig. Die Diskothek war mit bis zu fünf offenen Ladenkassen betrieben worden, deren Tagesgesamteinnahmen auf Zetteln erfasst und an die Buchhaltung übergeben worden waren; Kasseneinzelaufzeichnungen hatte der Kläger nicht vorlegen können. Aus diesem Grund verprobte der Prüfer die Getränkeumsätze für den Zeitraum Januar bis Mai 2013. Dazu erfasste er die gebuchten Eingangsrechnungen, deren Lieferdaten in den genannten Zeitraum fielen, ermittelte auf der Grundlage einer während der Prüfung durch den Kläger zur Verfügung gestellten Getränkekarte des Klägers für das Jahr 2015 mögliche Getränkeerlöse und verglich diese mit den tatsächlich gebuchten Getränkeerlösen. Der Prüfer kam zu dem Ergebnis, dass der Kläger mit den erfassten Getränken in dem betreffenden Zeitraum einen Netto-Umsatz von ... € hätte erzielen können. Erklärt worden war aber nur ein Netto-Umsatz von ... €; das entsprach 42,61 % des nach Ansicht des Prüfers möglichen Umsatzes. Der Kläger hatte zur Erläuterung auf Schankverluste, Personalgetränke und Freigetränke verwiesen, konnte dazu jedoch keine Unterlagen vorlegen. Der Prüfer zog daraus den Schluss, dass die Betriebseinnahmen und Umsätze nicht vollständig erklärt worden seien. Er führte eine Nachkalkulation durch und ermittelte unter Berücksichtigung eines Abschlags von insgesamt 10 % für Freigetränke, Personalverzehr und Schankverluste für das Streitjahr 2013 einen Hinzuschätzungsbetrag (alle folgenden Beträge netto) bei den Getränken von ... € und für das Streitjahr 2014 von ... €. Das entsprach einem Rohgewinnaufschlagsatz von 554,80 %. Des Weiteren nahm der Prüfer auf der Grundlage der geschätzten Getränkeerlöse Hinzuschätzungen bei den Eintrittsumsätzen (... € für 2013 und ... € für 2014) sowie bei den Garderobenumsätzen vor (... € für 2013 und ... € für 2014).

    4

    Die Einsprüche des Klägers gegen die entsprechend geänderten Bescheide über Einkommensteuer und Umsatzsteuer sowie über die Gewerbesteuermessbeträge für 2013 und 2014 blieben ohne Erfolg.

    5

    Mit seinem im ersten Rechtsgang erlassenen Urteil vom 03.09.2019 - 2 K 218/18 (Entscheidungen der Finanzgerichte --EFG-- 2020, 633) folgte das Finanzgericht (FG) dem FA insoweit, als es ebenfalls von einer Schätzungsbefugnis dem Grunde nach ausging. Es war aufgrund einer Beweisaufnahme zu dem Ergebnis gekommen, dass die Kassenzettel nicht den jeweiligen tatsächlichen Kassenbestand widerspiegelten. Allerdings beanstandete es sowohl die vom FA angewandte Schätzungsmethode als auch das Schätzungsergebnis.

    6

    Der Prüfer habe ausgehend von den seiner Meinung nach in den Cocktails enthaltenen Spirituosenmengen Verkaufspreise pro Liter ermittelt. Das sei aber keine korrekte Nachkalkulation oder Ausbeuteberechnung, weil "die Getränkerezepturen durch den schnell wechselnden Zeitgeschmack des jeweiligen Publikums geprägt" seien und er deshalb auf die konkret genutzten Rezepturen hätte abstellen müssen. Außerdem habe der Prüfer nicht berücksichtigt, dass der Kläger neben normalen Cocktails auch sogenannte Jumbococktails zu reduzierten Verkaufspreisen angeboten habe.

    7

    Aus diesem Grund schätzte das FG in Ausübung seiner eigenen Schätzungsbefugnis die Getränkeumsätze nach Maßgabe eines äußeren Betriebsvergleichs und legte dabei einen Rohgewinnaufschlagsatz von 300 % zugrunde. Zur Begründung berief es sich zum einen auf die vom Bundesministerium der Finanzen (BMF) veröffentlichten Richtsatzsammlungen 2013 (BMF-Schreiben vom 29.07.2014, BStBl I 2014, 1075) --RSS 2013-- und 2014 (BMF-Schreiben vom 14.07.2015, BStBl I 2015, 521) --RSS 2014--, die für Gast-, Speise- und Schankwirtschaften in den Streitjahren Rohgewinnaufschlagsätze zwischen 186 % und 400 % (RSS 2013) und zwischen 186 % und 376 % (RSS 2014) sowie einen Mittelwert von jeweils 257 % angeben, und zum anderen auf einen im verwaltungsinternen juris-Fachportal Steuerrecht "Fachinfosystem Bp NRW" nur für den Dienstgebrauch abrufbaren Bericht des Finanzamts Mönchengladbach-Mitte vom 23.05.2017 über Betriebsprüfungen bei Diskotheken. In diesem Bericht, den das FG als "spezielle Richtsatzsammlung für Diskotheken" bezeichnete, heißt es unter anderem, Diskotheken würden einen Rohgewinnaufschlagsatz zwischen 280 % und 600 % auf ihren Wareneinsatz anwenden, wobei sich die Mehrzahl der Betriebe im rechnerischen Mittel bewege. Dementsprechend setzte das FG die Hinzuschätzungen bei den Getränkeerlösen auf ... € (2013) und auf ... € (2014) herab. Die hinzugeschätzten Erlöse bei den Eintrittsgeldern und Garderobendienstleistungen verwarf das FG mit der Begründung, dass die Schätzungsparameter des FA unplausibel und willkürlich seien.

    8

    Das FA erließ daraufhin am 24.01.2020 entsprechend geänderte Bescheide.

    9

    Auf die Nichtzulassungsbeschwerde des Klägers hin hob der erkennende Senat das Urteil des ersten Rechtsgangs wegen eines Verfahrensfehlers auf und verwies die Sache an das FG zurück. Der Senat sah den Anspruch auf Gewährung rechtlichen Gehörs als verletzt an, weil das FG auf das "Fachinfosystem Bp NRW" zurückgegriffen hatte, ohne zuvor dem Kläger die hieraus gewonnenen Erkenntnisse inhaltlich zugänglich gemacht zu haben ( Beschluss vom 28.05.2020 - X B 12/20 , BFH/NV 2020, 1087).

    10

    Im zweiten Rechtsgang übersandte das FG den Beteiligten den Bericht des Finanzamts Mönchengladbach-Mitte vom 23.05.2017 über Betriebsprüfungen bei Diskotheken zur Kenntnisnahme. Sowohl der Kläger als auch das FA nahmen schriftsätzlich auf diesen Bericht Bezug.

    11

    Mit Urteil vom 13.10.2020 - 2 K 218/18 bestätigte das FG sein Ergebnis aus dem ersten Rechtsgang, bezog sich aber hinsichtlich des Ansatzes eines Rohgewinnaufschlagsatzes von (weiterhin) 300 % nunmehr nur noch auf die Richtsatzsammlungen des BMF und die dort aufgeführten Richtsätze für Gastronomiebetriebe (EFG 2022, 834). Zur Begründung führte das FG wie im ersten Rechtsgang aus, die vom FA durchgeführte Ausbeutekalkulation sei für eine Schätzung der Besteuerungsgrundlagen untauglich gewesen. Auch eine Geldverkehrs- oder Vermögenszuwachsrechnung sei nicht möglich gewesen, da nicht die gesamten Geldzuflüsse und Vermögenszuwächse des Klägers bekannt gewesen seien. Nach der höchstrichterlichen Rechtsprechung sei die Richtsatzschätzung eine anerkannte Schätzungsmethode. Die hiergegen von Teilen des Schrifttums erhobenen Einwände überzeugten nicht. Vor allem handele es sich bei der Richtsatzsammlung nicht um Rechtsnormen, sondern lediglich um Hilfsmittel, die nur unter Berücksichtigung der jeweiligen Umstände des Einzelfalls angewandt werden könnten. Den kritisierten statistischen Unzulänglichkeiten der Richtsatzsammlung komme deshalb keine so große Bedeutung zu, dass eine Schätzung, die sich an den Rohgewinnaufschlagsätzen orientiere, unzulässig wäre. Im Streitfall bewege sich der mit 300 % zugrunde gelegte Aufschlagsatz innerhalb des von der Richtsatzsammlung für Gastronomiebetriebe vorgegebenen Rahmens; er sei wirtschaftlich vernünftig und möglich. Die vom Kläger erklärten Aufschlagsätze von 148,5 % (2013) und 213,9 % (2014) hingegen lägen im Jahr 2013 noch unterhalb des untersten Wertes der Richtsatzsammlung.

    12

    Dagegen wendet sich der Kläger mit seiner Revision. Er trägt insbesondere vor, die Richtsätze des BMF böten keine zuverlässige Grundlage für Schätzungen. Die in die Richtsatzsammlung einfließenden Parameter verstießen gegen statistische Logiken und Regeln. So gehe die Richtsatzsammlung bereits von einer unzutreffenden Grundgesamtheit aus. In der Bundesrepublik Deutschland (Deutschland) existierten etwa acht Millionen Betriebe, die in 74 Gewerbeklassen der Richtsatzsammlung unterteilt seien. Wenn je Klasse circa 10 000 Vergleichsbetriebe berücksichtigt würden (s. Antwort der Bundesregierung vom 11.09.2018 auf die Kleine Anfrage vom 27.08.2018, BTDrucks 19/4238, S. 2, unter 2.), entspräche dies nur circa1/10 der Grundgesamtheit an Betrieben. Dies sei nach den statistischen Regeln deutlich zu wenig. Darüber hinaus fehle es oftmals an einer Vergleichbarkeit der Betriebe, die derselben Gewerbeklasse zugeordnet seien. So sei eine Diskothek nicht im Ansatz mit einer Gaststätte vergleichbar. Ferner sei nicht erkennbar, ob die Richtsatzsammlung länderspezifische Besonderheiten berücksichtige. Insgesamt sei unklar, aus welchen Quellen die Daten stammten, die Eingang in die Richtsatzsammlung fänden.

    13

    Es sei zudem davon auszugehen, dass die Auswahl der Ergebnisse für die Richtsatzsammlung über die Außenprüfungen in mehrfacher Hinsicht zielgerichtet gesteuert werde. Bereits die Auswahl der Prüfungen unterliege nicht dem reinen Zufallsprinzip. Unklar sei auch, ob beim "Datenzulauf" bestimmte Regionen innerhalb Deutschlands überproportional vertreten seien, zum Beispiel deshalb, weil dort intensiver durch die Finanzbehörden geprüft werde. Der Richtsatzsammlung sei auch nicht zu entnehmen, ob nur die von der Außenprüfung ermittelten Ergebnisse in die Sammlung eingingen oder darüber hinaus im Fall eines ganz oder teilweise erfolgreichen Rechtsbehelfs des Steuerpflichtigen gegen die Auswertungsbescheide entsprechende Korrekturen angebracht würden. Statistisch verfälschend wirke, dass die Ergebnisse von Verlustbetrieben nicht in die Richtsatzsammlung einbezogen würden.

    14

    Die Zahl der je Prüfungsjahr ausgewerteten Außenprüfungen sei sowohl im Verhältnis zur Anzahl der Betriebe je Gewerbeklasse als auch im Verhältnis zu den gesamten Betrieben zu gering, um statistisch relevant zu sein. Nur die Ergebnisse der Außenprüfungen von etwa sechs Promille der Betriebe pro Prüfungsjahr und Gewerbeklasse flössen neu in die Richtsatzsammlung ein. Dies bestätige auch die Antwort des Sächsischen Staatsministeriums der Finanzen an den Sächsischen Landtag vom 15.01.2021 (Drucksache Nr. 7/4787). In der Anlage zu dieser Antwort werde die Anzahl der in Sachsen vorhandenen Gaststätten mit 4 761 beziffert, die Anzahl der im Jahr 2015 ausgewerteten Prüfungen mit 27; das entspreche 0,5671 %. Dies sei keine Statistik, sondern Zufall.

    15

    Auch hätten FA und FG nicht hinreichend berücksichtigt, dass es sich bei dem Betrieb des Klägers um die einzige "...disco" auf dem "..." gehandelt habe, zu deren Publikum insbesondere auch minderjährige Schüler gehört hätten, denen nur mit einer entsprechenden elterlichen Erlaubnis Zutritt gewährt worden sei. Gerade Schüler seien "sehr preissensibel" und würden auf unterschiedliche Weise durch Freigetränke geworben. In den Richtsätzen werde eine solche Werbe- und Preispolitik nicht abgebildet. Daher hätte der vorliegende Fall nicht nach der bundesweiten Richtsatzsammlung für Gaststätten beurteilt werden dürfen. Außerdem hätte der "Schwund" beim Ausschank durch Freigetränke nicht durch einen Abschlag von nur 10 % berücksichtigt werden dürfen; realistischer wären 33 % oder gar 50 % gewesen. Das FG habe hier trotz des umfangreichen und rechnerisch belastbaren Vortrags seine eigenen Aufklärungspflichten vernachlässigt und sei sofort auf die Richtsatzschätzung umgeschwenkt.

    16

    In Anbetracht der Unzulässigkeit einer auf der BMF-Richtsatzsammlung beruhenden Schätzung komme wegen der --nicht mehr bestrittenen-- formellen Aufzeichnungsmängel allenfalls ein pauschaler Sicherheitszuschlag zu den erklärten Besteuerungsgrundlagen von 5 % in Betracht.

    17

    Der Kläger beantragt,

    das vorinstanzliche Urteil aufzuheben und die Festsetzungen zur Einkommen- und Umsatzsteuer sowie zum Gewerbesteuermessbetrag für die Jahre 2013 und 2014, zuletzt in der Fassung der Änderungsbescheide vom 24.01.2020, dahingehend abzuändern, dass bei den gewerblichen Gewinnen und Umsätzen nur eine Hinzuschätzung zu den erklärten Werten von jeweils 5 % (... € für 2013 und ... € für 2014) vorgenommen wird.

    18

    Das FA beantragt,

    die Revision zurückzuweisen.

    19

    Es führt an, dass die Richtsatzsammlung des BMF die vom Kläger angeführten statistischen Unzulänglichkeiten nicht aufweise. Die Richtsatzschätzung sei eine anerkannte Schätzungsmethode. Wer keine ordnungsgemäße Buchführung vorhalte, müsse die Ungenauigkeiten einer Richtsatzschätzung hinnehmen. Dass die Ergebnisse aus Verlustbetrieben nicht in die Richtsätze einflössen, sei sachgerecht. Denn Verluste entstünden oftmals zu Beginn der jeweiligen gewerblichen Tätigkeit, während ein Betrieb, der über einen längeren Zeitraum Verluste erwirtschafte, auf Dauer vom Markt verschwinden werde. Dementsprechend fehle es an einer Vergleichbarkeit mit anderen Betrieben. Darüber hinaus sei keine Rechtsverletzung des Klägers erkennbar. Diskothekenbetriebe stellten nach der Richtsatzsammlung keine eigene Gewerbeklasse dar, sondern seien den --vergleichbaren-- Gastronomiebetrieben zuzuordnen. Dies stelle keine Benachteiligung dar, da in Diskotheken ausschließlich Getränke verkauft würden, bei denen regelmäßig höhere Rohgewinnaufschlagsätze als beim Verkauf von Speisen erzielt würden. Im Übrigen sei der im Streitfall vom FG berücksichtigte Rohgewinnaufschlagsatz "äußerst angemessen" gewesen. Die von dem Prüfer durchgeführte Ausbeutekalkulation habe einen deutlich höheren Aufschlagsatz ausgewiesen. Selbst wenn man die von dem FG beanstandeten Erlöse aus dem Verkauf von Cocktails herausrechnete, läge der Rohgewinnaufschlagsatz immer noch deutlich über den vom FG angenommenen 300 %. Allerdings wäre aus Sicht des FA eine Anwendung der Richtsatzsammlung im Streitfall nicht zwingend notwendig gewesen, da auch die Schätzungsmethode der Ausbeutekalkulation hätte gewählt werden können. Alle dafür relevanten Informationen zum Wareneinkauf und zum Verkaufspreis der Getränke hätten vorgelegen.

    20

    Das BMF ist dem Verfahren gemäß § 122 Abs. 2 der Finanzgerichtsordnung (FGO) beigetreten. In seiner Stellungnahme führt das BMF (unter anderem) aus: Richtsätze würden für circa 10 % aller Gewerbeklassen ermittelt und in der amtlichen Richtsatzsammlung veröffentlicht. Zurzeit flössen jährlich circa 5 000 Ergebnisse geprüfter Betriebe aus allen 16 Bundesländern in die Ermittlung der Richtsätze ein. Knapp 25 % der umsatzsteuerpflichtigen Unternehmen seien den rund 75 Gewerbeklassen, für die Richtsätze ermittelt würden, zugeordnet. Für die Richtsatzsammlung würden nur Betriebe der Größenklassen "M, K und Kst" betrachtet. Da die Richtsatzsammlung die Verhältnisse von Normalbetrieben abbilden solle, würden für die Richtsatzermittlung Nebenerwerbsbetriebe (Umsatz unter 10.000 €) und Verlustbetriebe nicht berücksichtigt. Zudem eigneten sich Betriebe mit außergewöhnlichen betrieblichen oder persönlichen Verhältnissen nicht für Richtsatzermittlungen.

    21

    Die Vorgehensweise zur Ermittlung der Richtsätze basiere auf einem mathematisch-statistischen Verfahren, das Toleranzintervalle der zu schätzenden Merkmalswerte anhand von Stichprobenergebnissen konstruiere. Dieses Verfahren sei beschrieben und für seine Anwendung in der Finanzverwaltung begutachtet worden. Gegenstand dieses Gutachtens vom 12.04.1985 sei die Fragestellung gewesen, wie viele Betriebsprüfungsergebnisse (Stichprobenumfang) für die Festlegung eines Toleranzintervalls (hier des unteren und oberen Rahmensatzes) berücksichtigt werden müssten, damit mit hoher Sicherheit ein ausreichend hoher Anteil aller Betriebe in diesem Intervall liege. Die Besonderheit dieser Methode liege darin, dass sie unabhängig von Verteilungsannahmen der unterliegenden Grundgesamtheit sei. Um die notwendige Stichprobengröße zu erreichen, müssten je Gewerbeklasse mindestens 170 bis 340 Ergebnisse aus Betriebsprüfungen (abhängig von der Anzahl der Umsatzgruppen je Gewerbeklasse) bei der Richtsatzermittlung berücksichtigt werden. Der untere und obere Rahmensatz werde jeweils so festgelegt, dass etwa 80 % der geprüften Ergebnisse innerhalb des Rahmens lägen. Dadurch könne man bei einer Stichprobe von beispielsweise 100 Fällen mit einer hohen Sicherheitswahrscheinlichkeit davon ausgehen, dass mindestens 70 % aller Betriebsergebnisse in diesem Rahmen lägen. Der Rahmen sei konservativ geschätzt, so dass die Sicherheitswahrscheinlichkeit bei ungefähr 97 % liege.

    22

    Das BMF habe unter Mitwirkung des Statistischen Bundesamts das mathematische Gutachten vom 12.04.1985 überprüft und sei danach zu dem Ergebnis gelangt, dass das in dem Gutachten verwendete Verfahren eine anerkannte Schätzmethode für nichtparametrische Toleranzintervalle sei und hier zur Anwendung kommen könne. Zu beachten sei, dass die getroffenen Aussagen auf der Verwendung von "echten Zufallsstichproben" beruhen müssten. Die einzelnen Prüfungsfälle würden dezentral durch die Länder ausgewählt. Die Anzahl der zu liefernden Ergebnisse je Bundesland ergebe sich abhängig von der Einwohnerzahl.

    23

    Regionale Unterschiede bei den fixen Betriebskosten stünden der Festlegung bundeseinheitlicher Richtsätze nicht entgegen; denn aus der allgemeinen Prüfererfahrung ergebe sich die Beobachtung, dass höhere Fixkosten (zum Beispiel Raum- und Personalkosten) gegebenenfalls durch höhere Verkaufspreise an die Kunden weitergegeben würden. Die Aufschlagsätze veränderten sich dadurch, wenn überhaupt, nur marginal. Sollte es dennoch zu einer Belastung der Unternehmen kommen, werde dies durch die Spannbreite der einzelnen Aufschlagsätze abgedeckt. Betriebliche Besonderheiten seien im Rahmen der Mitwirkung durch den Steuerpflichtigen plausibel zu erklären.

    24

    Verlustbetriebe entsprächen nicht einem Normalbetrieb im Sinne der Definition der Richtsatzsammlung und seien daher nicht zu berücksichtigen. Andernfalls könnten sich bei den unteren Rahmensätzen negative Werte ergeben, die dann in der Richtsatzsammlung ausgewiesen werden müssten und gegebenenfalls zu negativen Hinzuschätzungsbeträgen führten. Dies stünde dem Sinn und Zweck der Richtsatzsammlung und dem Grundsatz der Gleichmäßigkeit der Besteuerung entgegen; denn die Richtsatzsammlung finde erst dann Anwendung, wenn die formelle und materielle Ordnungsmäßigkeit der Buchführung nicht gegeben und kein besser geeignetes Mittel zur Begründung der Schätzungshöhe verfügbar sei.

    25

    Eine nachträgliche Berücksichtigung von Werten nach einem Rechtsbehelfsverfahren sei nicht praktikabel. Für die Richtsatzermittlungen würden jährlich Betriebsprüfungen durchgeführt. Es seien aber zur Gewährleistung möglichst zeitnaher Ergebnisse und einer möglichst zeitnahen Veröffentlichung einheitliche Fristen festgelegt. Ohnehin dürfte der Anteil von Richtsatzprüfungen, die Gegenstand eines Rechtsbehelfsverfahrens werden, gering sein.

    26

    Die amtliche Richtsatzsammlung werde auf der Internetseite des BMF und im Bundessteuerblatt Teil I veröffentlicht. Der Allgemeinheit stünden damit alle Informationen zur Verfügung, die erforderlich seien, um sich über die Folgen einer Verletzung von Mitwirkungspflichten zu informieren. Nicht öffentlich zugänglich seien die zugrunde liegenden Einzelwerte. Eine Aufschlüsselung nach Betriebsart und Region sowie nach einzelnen Kennzahlen würde Rückschlüsse auf den jeweiligen Steuerpflichtigen ermöglichen und wäre mit dem Steuergeheimnis ( § 30 der Abgabenordnung --AO--) nicht zu vereinbaren.

    27

    Auf das Gutachten vom 12.04.1985, das das BMF im Revisionsverfahren vorgelegt hat, wird Bezug genommen.

    28

    Einen eigenen Antrag hat das beigetretene BMF nicht gestellt.

    29

    Mit Beschluss vom 29.12.2023 hat der Senat A als Beistand des BMF zugelassen.

    II.

    30

    Die Revision ist begründet. Sie führt zur Aufhebung des angefochtenen Urteils und zur Zurückverweisung der Sache zur anderweitigen Verhandlung und Entscheidung ( § 126 Abs. 3 Satz 1 Nr. 2 FGO ).

    31

    Zwar hat das FG zutreffend eine Schätzungsbefugnis dem Grunde nach bejaht (unter 1.). Allerdings ist die vom FG vorgenommene Hinzuschätzung in Form eines äußeren Betriebsvergleichs auf der Grundlage der amtlichen Richtsatzsammlung des BMF nicht nachvollziehbar begründet worden und kann daher nicht auf ihre Angemessenheit hin überprüft werden (unter 2.). Da dem Senat keine eigene Schätzungsbefugnis zukommt, muss die Sache erneut zur anderweitigen Verhandlung und Entscheidung an das FG zurückverwiesen werden (unter 3.). Der Senat weist ergänzend und nicht tragend --auch unter Bezugnahme auf seinen Beschluss vom 14.12.2022-- darauf hin, dass erhebliche Zweifel an der Eignung der Richtsatzsammlung in ihrer bisherigen Form als Grundlage für eine Schätzung bestehen (unter 4.).

    32

    1. Das FG hat in revisionsrechtlich nicht zu beanstandender Weise entschieden, dass im Streitfall eine Schätzungsbefugnis dem Grunde nach bestand.

    33

    a) Nach § 162 Abs. 1 Satz 1 AO hat die Finanzbehörde die Besteuerungsgrundlagen zu schätzen, soweit sie diese nicht ermitteln oder berechnen kann. § 96 Abs. 1 Satz 1 Halbsatz 2 FGO i.V.m. § 162 AO gibt dem FG eine eigene Schätzungsbefugnis.

    34

    aa) Gemäß § 162 Abs. 2 Satz 1 AO ist insbesondere dann zu schätzen, wenn der Steuerpflichtige über seine Angaben keine ausreichenden Aufklärungen zu geben vermag oder weitere Auskunft oder eine Versicherung an Eides statt verweigert oder seine Mitwirkungspflicht nach § 90 Abs. 2 AO verletzt.

    35

    Nach § 162 Abs. 2 Satz 2 AO gilt das Gleiche, wenn der Steuerpflichtige Bücher oder Aufzeichnungen, die er nach den Steuergesetzen zu führen hat, nicht vorlegen kann, wenn die Buchführung oder die Aufzeichnungen der Besteuerung nicht nach § 158 Abs. 2 AO --in den Streitjahren: § 158 AO a.F.-zugrunde gelegt werden oder wenn tatsächliche Anhaltspunkte für die Unrichtigkeit oder Unvollständigkeit der vom Steuerpflichtigen gemachten Angaben zu steuerpflichtigen Einnahmen oder Betriebsvermögensmehrungen bestehen und der Steuerpflichtige die Zustimmung nach § 93 Abs. 7 Satz 1 Nr. 5 AO nicht erteilt.

    36

    Gemäß § 158 AO a.F. sind die Aufzeichnungen des Steuerpflichtigen, die den Vorschriften der §§ 140 bis 148 AO entsprechen, der Besteuerung zugrunde zu legen, soweit nach den Umständen des Einzelfalls kein Anlass ist, ihre sachliche Richtigkeit zu beanstanden.

    37

    bb) Formelle Buchführungsmängel berechtigen nach ständiger Rechtsprechung nur insoweit zur Schätzung, als sie Anlass geben, die sachliche Richtigkeit des Buchführungsergebnisses anzuzweifeln (z.B. Senatsurteil vom 25.03.2015 - X R 20/13 , BFHE 249, 390, BStBl II 2015, 743, Rz 34; Urteile des Bundesfinanzhofs --BFH-- vom 12.12.2017 - VIII R 5/14 , BFH/NV 2018, 602, Rz 38; vom 16.12.2021 - IV R 2/18 , BFH/NV 2022, 313, Rz 32, und vom 16.12.2021 - IV R 1/18 , BFH/NV 2022, 305, Rz 43; Senatsbeschlüsse vom 12.07.2017 - X B 16/17 , BFHE 257, 523, Rz 56, und vom 21.08.2019 - X B 120/18 , BFH/NV 2022, 744, Rz 21).

    38

    cc) Bei einer offenen Ladenkasse begründet die fehlende Kassensturzfähigkeit einen formellen Buchführungsmangel.

    39

    (1) Kasseneinnahmen und Kassenausgaben sollen gemäß § 146 Abs. 1 Satz 2 AO a.F. täglich festgehalten werden. Zweck dieser Regelung ist es, im sensiblen Bereich der Abwicklung von Vorgängen, die Bewegungen von Bargeld einschließen, ein möglichst dichtes Kontrollgefüge einzurichten. Die Anforderungen an ein solches Kontrollgefüge sind dabei an die Art und Weise der Kassenführung anzupassen. Grundsätzlich ist der Steuerpflichtige in der Wahl des Aufzeichnungsmittels frei und kann entscheiden, ob er seine Warenverkäufe manuell oder unter Zuhilfenahme technischer Hilfsmittel erfasst, etwa einer elektronischen Registrier- oder PC-Kasse. Dabei bestimmt die Kasseneigenschaft die Art der Aufzeichnung ( Senatsurteil vom 20.03.2017 - X R 11/16 , BFHE 258, 272, BStBl II 2017, 992, Rz 37 ff.; Senatsbeschluss vom 08.08.2019 - X B 117/18 , BFH/NV 2019, 1219, Rz 17).

    40

    (2) Im Fall einer offenen Ladenkasse müssen zur Gewährleistung der sogenannten Kassensturzfähigkeit auf der Grundlage eines tatsächlichen Auszählens der Bareinnahmen tägliche Kassenberichte erstellt werden. Ein "Zählprotokoll" ist nicht erforderlich. Die Kassenberichte müssen so beschaffen sein, dass ein Buchsachverständiger in der Lage ist, zumindest am Beginn und am Ende jedes Geschäftstages --bei Einzelaufzeichnung der Bareinnahmen auch jederzeit im Laufe des Geschäftstages-- den durch Kassensturz festgestellten Ist-Bestand anhand der Kassenaufzeichnungen zu überprüfen. Dies gilt trotz der Ausgestaltung des § 146 Abs. 1 Satz 2 AO a.F. als Soll-Vorschrift; denn auch wenn hierdurch zum Ausdruck kommt, dass eine tägliche Aufzeichnung nicht in jedem Fall zwingend erforderlich ist, muss die Entwicklung des Kassenbestandes zweifelsfrei rekonstruierbar sein ( Senatsurteil vom 20.03.2017 - X R 11/16 , BFHE 258, 272, BStBl II 2017, 992, Rz 40 f.).

    41

    (3) Fehlt es an der Kassensturzfähigkeit, liegt ein formeller Buchführungsmangel vor, der --wie eingangs dargelegt-- nach ständiger höchstrichterlicher Rechtsprechung grundsätzlich zwar nur insoweit zur Schätzung berechtigt, als er Anlass gibt, die sachliche Richtigkeit des Buchführungsergebnisses anzuzweifeln. Werden aber vorwiegend Bargeschäfte getätigt, können Mängel der Kassenführung die gesamte Buchführung in Frage stellen und ihr die Ordnungsmäßigkeit nehmen ( Senatsurteil vom 20.03.2017 - X R 11/16 , BFHE 258, 272, BStBl II 2017, 992, Rz 48; Senatsbeschluss vom 12.07.2017 - X B 16/17 , BFHE 257, 523, Rz 56).

    42

    b) Im vorliegenden Fall war nach den Feststellungen des FG die Kassensturzfähigkeit der in der Diskothek im Zusammenhang mit dem Verkauf von Getränken verwendeten offenen Geldkassen nicht gegeben.

    43

    Kasseneinzelaufzeichnungen sind nicht geführt worden oder liegen jedenfalls nicht vor. Auch die mit "Abend Abrechnung" überschriebenen Zettel, auf denen die Tageseinnahmen erfasst worden sind, konnten nur für einzelne Tage vorgelegt werden. Im Übrigen erfolgten die Abrechnungen nicht taggenau oder zumindest hinreichend zeitnah. Bareinkäufe wurden, soweit ersichtlich, überwiegend erst nach einigen Tagen in den Kassenbestandsrechnungen erfasst. Dies lässt sich anhand der von dem Kläger im Klageverfahren vorgelegten Unterlagen, auf die das FG Bezug genommen hat, nachvollziehen. Da es sich bei der Diskothek unstreitig um einen "bargeldintensiven Betrieb" handelte und die festgestellten Mängel damit den Kernbereich der Buchführung des Klägers betrafen, war das FA zur Schätzung der Einnahmen dem Grunde nach berechtigt.

    44

    Der Kläger hat diese Feststellungen und die daraus gezogene rechtliche Schlussfolgerung einer Schätzungsbefugnis hinsichtlich der Getränkeumsätze dem Grunde nach im Revisionsverfahren im zweiten Rechtsgang auch nicht mehr in Frage gestellt. Der Senat sieht daher von weiteren Ausführungen ab.

    45

    2. Zwar waren demnach FA und FG im Streitfall dem Grunde nach zur Schätzung befugt. Die vom FG vorgenommene Hinzuschätzung auf der Grundlage eines äußeren Betriebsvergleichs und unter Berücksichtigung eines Rohgewinnaufschlagsatzes von 300 % ist aber nicht nachvollziehbar begründet worden.

    46

    a) Gemäß § 162 Abs. 1 Satz 2 AO (i.V.m. § 96 Abs. 1 Satz 1 Halbsatz 2 FGO ) sind bei der Schätzung alle Umstände zu berücksichtigen, die für sie von Bedeutung sind. Die daraus resultierenden Schätzungsergebnisse müssen schlüssig, wirtschaftlich möglich und vernünftig sein (s. statt vieler Senatsurteil vom 17.06.2020 - X R 26/18 , BFH/NV 2021, 314, Rz 23).

    47

    aa) Unter diesen Voraussetzungen sind FA und FG in der Wahl ihrer Schätzungsmethoden grundsätzlich frei (unter (1)). Eingeschränkt wird diese Freiheit allerdings durch die allgemein geltenden gesetzlichen Grenzen der Ermessensausübung (unter (2)).

    48

    (1) Der BFH hat wiederholt den Grundsatz bestätigt, dass das FA und gemäß § 96 Abs. 1 Satz 1 FGO i.V.m. § 162 AO auch das FG in der Wahl ihrer Schätzungsmethoden frei sind. Es ist letztlich Sache der Tatsacheninstanz, zu entscheiden, welcher Schätzungsmethode sie sich bedienen will, vorausgesetzt, diese ist geeignet, ein vernünftiges und der Wirklichkeit entsprechendes Ergebnis zu erzielen. Der Steuerpflichtige selbst hat keinen Anspruch auf die Anwendung einer bestimmten Schätzungsmethode. Weder das FA noch das FG sind zudem grundsätzlich verpflichtet, das aufgrund einer Schätzungsmethode gewonnene Ergebnis durch die Anwendung einer weiteren Schätzungsmethode zu überprüfen oder zu untermauern ( BFH-Urteil vom 16.12.2021 - IV R 1/18 , BFH/NV 2022, 305, Rz 49; Senatsbeschlüsse vom 07.02.2017 - X B 79/16 , BFH/NV 2017, 774, Rz 25, und vom 21.07.2017 - X B 167/16 , BFH/NV 2017, 1447, Rz 18, jeweils m.w.N.).

    49

    (2) Allerdings ergibt sich aus § 5 AO in Verbindung mit dem Grundsatz der Verhältnismäßigkeit, dass die Wahlfreiheit des FA beziehungsweise des FG bei der Auswahl zwischen mehreren in Betracht kommenden Schätzungsmethoden nach den allgemeinen für die Ausübung pflichtgemäßen Ermessens geltenden Grundsätzen eingeschränkt ist und dass dabei auch Verhältnismäßigkeitserwägungen zu beachten sind.

    50

    (a) Jede Schätzung hat zum Ziel, Besteuerungsgrundlagen mit Hilfe von Wahrscheinlichkeitsüberlegungen zu ermitteln, wenn eine sichere Tatsachenfeststellung trotz des Bemühens um Aufklärung nicht möglich ist. Ermessensleitend ist deshalb das Ziel, die Besteuerungsgrundlagen durch Wahrscheinlichkeitsüberlegungen so zu bestimmen, dass sie der Wirklichkeit möglichst nahekommen. Kommt eine bestimmte Schätzungsmethode diesem Ziel voraussichtlich näher als eine andere, ist die erstgenannte Schätzungsmethode unter Ermessensgesichtspunkten vorzugswürdig ( Senatsurteil vom 25.03.2015 - X R 20/13 , BFHE 249, 390, BStBl II 2015, 743, Rz 60; ebenso BFH-Urteil vom 23.11.2023 - VI R 15/21 , BFHE 283, 42, BStBl II 2024, 361, Rz 30).

    51

    Die weitgehende Freiheit des FA und des FG besteht folglich nur dann, wenn mehrere gleich geeignete Schätzungsmethoden zur Auswahl stehen (s.a. Kulosa, Der Betrieb --DB-- 2015, 1797, 1798). Ist dies nicht der Fall, wird das Ermessen von FA und FG eingeschränkt. Sie müssen sich für diejenige Schätzungsmethode entscheiden, welche die größere Gewähr dafür bietet, mit zumutbarem Aufwand das wahrscheinlichere Ergebnis zu erzielen (so zutreffend Seer inTipke/Kruse, § 162 AO Rz 52). Tendenziell ungenauere Methoden sind gegenüber genaueren Methoden nachrangig (vgl. Senatsurteil vom 25.03.2015 - X R 20/13 , BFHE 249, 390, BStBl II 2015, 743, Rz 59; Kulosa,DB 2015, 1797, 1798).

    52

    (b) Die Wahrscheinlichkeit, dass eine Schätzung der Wirklichkeit möglichst nahekommt, wird umso größer sein, je umfangreicher und detaillierter sich der der Schätzung zugrunde gelegte Sachverhalt (Ausgangssachverhalt) aufklären lässt und je zuverlässiger die angewandte Schätzungsmethode ist. Eine genaue Bestimmung der Besteuerungsgrundlagen kann allerdings im Schätzungswege trotz Bemühens um Zuverlässigkeit allenfalls zufällig erreicht werden ( BFH-Urteile vom 26.04.1983 - VIII R 38/82 , BFHE 138, 323, BStBl II 1983, 618, unter 4.a, b, und vom 18.12.1984 - VIII R 195/82 , BFHE 142, 558, BStBl II 1986, 226, unter 2.).

    53

    (c) Unterschieden wird (unter anderem) zwischen Umsatzschätzungen durch äußeren und durch inneren Betriebsvergleich.

    54

    Im Allgemeinen haftet dem äußeren Betriebsvergleich ein starkes Unsicherheitsmoment an, da kaum ein Betrieb dem anderen gleicht. Daher ist grundsätzlich ein innerer Betriebsvergleich als die zuverlässigere Schätzungsmethode anzusehen ( BFH-Urteil vom 26.04.1983 - VIII R 38/82 , BFHE 138, 323, BStBl II 1983, 618, unter 4.c). Zwar ist auch eine Nachkalkulation nicht frei von Unsicherheiten; doch ist hier die Möglichkeit von Fehlern stärker eingeengt ( BFH-Urteil vom 26.04.1983 - VIII R 38/82 , BFHE 138, 323, BStBl II 1983, 618, unter 4.c).

    55

    bb) Des Weiteren haben sowohl das FA als auch das FG das Ergebnis ihrer Schätzung nachvollziehbar zu begründen. Sie müssen die der Schätzung zugrunde liegenden konkreten, betriebsbezogenen Annahmen benennen, damit die Beteiligten --und auch das Revisionsgericht-- nachprüfen können, ob die Schätzung den gesetzlichen Vorgaben entspricht, ob sie also insbesondere schlüssig, wirtschaftlich möglich und vernünftig ist (vgl. Senatsurteile vom 19.07.2011 - X R 48/08 , BFH/NV 2011, 2032, Rz 20, und vom 20.03.2017 - X R 11/16 , BFHE 258, 272, BStBl II 2017, 992, Rz 52; BFH-Urteil vom 18.12.1984 - VIII R 195/82 , BFHE 142, 558, BStBl II 1986, 226, unter 3.).

    56

    Das FA und das FG haben darzulegen, wie sie ihre Überzeugung gewonnen haben und dass die Überzeugungsbildung in rechtlich zulässiger und einwandfreier Weise zustande gekommen ist ( BFH-Urteil vom 16.12.2021 - IV R 1/18 , BFH/NV 2022, 305, Rz 48, m.w.N.; Senatsurteil vom 28.11.2023 - X R 3/22 , BFHE 283, 66, BStBl II 2024, 329, Rz 56). Zwar ist die tatrichterliche Überzeugungsbildung revisionsrechtlich nur eingeschränkt überprüfbar, sie muss aber gleichwohl verstandesmäßig einsichtig und logisch nachvollziehbar sein. Sie darf keine inneren Widersprüche aufweisen, lückenhaft oder unklar sein oder gegen die Denkgesetze oder gesichertes Erfahrungswissen verstoßen. Außerdem muss sie sich auf festgestellte Tatsachen stützen. Sind diese Voraussetzungen nicht erfüllt, kann dies bereits einen sachlich-rechtlichen Mangel des Urteils begründen, den das Revisionsgericht auch ohne besondere Rüge beanstanden kann (vgl. allgemein zur gerichtlichen Überzeugungsbildung nach § 96 Abs. 1 Satz 1 Halbsatz 1 FGO Senatsurteil vom 16.09.2015 - X R 43/12 , BFHE 251, 37, BStBl II 2016, 48, Rz 40).

    57

    cc) Soll eine Schätzung von Besteuerungsgrundlagen durch einen äußeren Betriebsvergleich erfolgen, ist darüber hinaus zu beachten, dass der Betrieb, dessen Besteuerungsgrundlagen geschätzt werden müssen, und die zum Vergleich herangezogenen Betriebe grundsätzlich zu der gleichen Branche gehören und sich auch im Hinblick auf Betriebsgröße, Lage, Organisation und Kundenstamm ähnlich sein sollten (vgl. auch FG München, Urteil vom 17.09.2002 - 6 K 3622/01 , unter II.3.; ebenso FG Rheinland-Pfalz, Urteil vom 22.11.2017 - 2 K 2119/15 , und FG München, Beschluss vom 06.10.2017 - 7 V 2008/17 , unter II.2.1.). Bestehen im Hinblick auf diese Merkmale wesentliche Unterschiede, muss nachvollziehbar begründet werden, warum trotzdem ein äußerer Betriebsvergleich möglich und geboten erscheint.

    58

    Eine besondere Form des äußeren Betriebsvergleichs ist die sogenannte Richtsatzschätzung, also eine Schätzung anhand der Kennzahlen der amtlichen Richtsatzsammlung des BMF. Diese Schätzungsmethode wird von der höchstrichterlichen Rechtsprechung bislang als grundsätzlich zulässig anerkannt (vgl. u.a. aus jüngerer Zeit BFH-Urteile vom 16.12.2021 - IV R 1/18 , BFH/NV 2022, 305, Rz 60, und vom 16.12.2021 - IV R 2/18 , BFH/NV 2022, 313, Rz 49; Senatsbeschluss vom 08.08.2019 - X B 117/18 , BFH/NV 2019, 1219, Rz 37; BFH-Beschlüsse vom 14.08.2018 - XI B 2/18 , BFH/NV 2019, 1, Rz 20; vom 01.08.2014 - V S 16/14 (PKH) , BFH/NV 2014, 1768, Rz 25, sowie vom 05.12.2007 - X B 4/07 , BFH/NV 2008, 587, unter 1.c; ebenso zum Steuerstrafrecht Urteil des Bundesgerichtshofs --BGH-- vom 08.03.2022 - 1 StR 360/21 , Zeitschrift für Wirtschafts- und Steuerstrafrecht --wistra--2022, 338, Rz 13; BGH-Beschlüsse vom 11.03.2021 - 1 StR 521/20 , Neue Zeitschrift für Strafrecht --NStZ-- 2021, 743, Rz 14, und vom 14.05.2020 - 1 StR 6/20 ,wistra 2021, 28, Rz 25, jeweils m.w.N.).

    59

    Ungeachtet der Zweifel, die der Senat zuletzt an der Belastbarkeit der Richtsatzschätzung geäußert hat (Senatsbeschluss vom 14.12.2022 - X R 19/21 , BFHE 278, 428, Rz 26, m.w.N. - s. dazu unter 4.), können für die Schätzung der Besteuerungsgrundlagen eines Betriebs grundsätzlich nur Richtsätze derjenigen Gewerbeklasse verwendet werden, der der Betrieb zuzuordnen ist. Sollen Richtsätze einer anderen Gewerbeklasse verwendet werden, muss nachvollziehbar begründet werden, warum trotzdem ein Betriebsvergleich möglich und geboten erscheint.

    60

    b) Diesen Anforderungen entspricht die Begründung des FG nicht.

    61

    aa) Zunächst hat das FG nicht nachvollziehbar begründet, warum es die Möglichkeit eines inneren Betriebsvergleichs verworfen hat.

    62

    Eine Nachkalkulation auf der Grundlage des Wareneinsatzes ist nach den dargestellten Grundsätzen als Methode des inneren Betriebsvergleichs eher geeignet, das für den Betrieb des Klägers wahrscheinlichere Ergebnis zu finden, als ein äußerer Betriebsvergleich. Tatsächlich hat der Prüfer für den Zeitraum Januar bis Mai 2013 anhand der gebuchten Eingangsrechnungen und unter Berücksichtigung der in diesem Zeitraum auch tatsächlich gelieferten Getränke die mutmaßlichen Verkaufserlöse ermittelt. Soweit das FG der Auffassung ist, die Berechnung des Prüfers sei "keine taugliche Nachkalkulation", weil dieser nicht auf die vom Kläger tatsächlich verwendeten Rezepturen für Cocktails abgestellt habe, hätte es, um selbst die Grundlage für eine verbesserte Nachkalkulation zu schaffen, dem Kläger Gelegenheit geben können, die aus seiner Sicht zur Berechnung erforderlichen Rezepturen, einschließlich der für die sogenannten Jumbococktails, vorzulegen. Sofern eine solche Nachkalkulation aus Sicht des FG den zumutbaren Aufwand überstiegen hätte, hätte auch dies begründet werden müssen. Im Übrigen hat sich das FG auch nicht damit auseinandergesetzt, warum die Nachkalkulation des Prüfers nicht auch ohne konkrete Rezepturen möglich war. Wenn die "Jumbococktails" nicht ausreichend berücksichtigt worden sein sollten, hätte es nahegelegen, dafür Abschläge bei den angenommenen Erlösen für die zugrunde gelegte Maßeinheit von 0,02 cl vorzunehmen, anstatt den inneren Betriebsvergleich insgesamt zu verwerfen.

    63

    Hätte der Kläger die tatsächlich verwendeten Rezepturen nicht mehr vorlegen können, wäre dies zu seinen Lasten gegangen. Die sich daraus ergebenden Unsicherheiten hätte er hinnehmen müssen.

    64

    bb) Des Weiteren hat das FG nicht hinreichend begründet, auf welcher tatsächlichen Grundlage es zu der Überzeugung gelangt ist, dass zur Ermittlung der Besteuerungsgrundlagen des Betriebs des Klägers --einer Diskothek-- im Schätzungswege die in der amtlichen Richtsatzsammlung des BMF festgelegten Richtsätze für Gaststätten herangezogen werden können.

    65

    (1) Eine Diskothek lässt sich keiner der in der amtlichen Richtsatzsammlung aufgeführten Gewerbeklassen zuordnen.

    66

    (a) In den Vorbemerkungen zur RSS 2013 und zur RSS 2014 wird im Abschnitt "A) Allgemeines" ausgeführt, die Richtsätze seien für die einzelnen Gewerbeklassen auf der Grundlage von Betriebsergebnissen "zahlreicher geprüfter Unternehmen" ermittelt worden (unter 2.) und stellten auf die Verhältnisse eines "Normalbetriebs" ab (unter 3.).

    67

    Zu den Vorbemerkungen zu den amtlichen Richtsatzsammlungen gehört eine Anlage "Synonyme der in der Richtsatzsammlung aufgeführten Gewerbeklassen in alphabetischer Reihenfolge". Dieser Anlage zufolge werden der Gewerbeklasse "Gast- und Speisewirtschaften" (RSS 2013) beziehungsweise "Gaststätten" (RSS 2014) neben den eigentlichen Gaststätten auch Bierwirtschaften, Pizzerien, Restaurants und Restaurants mit asiatischem Speiseangebot, Schankwirtschaften, Speisewirtschaften, Weinwirtschaften und allgemein Wirtschaften sowie Cafés (nur RSS 2013) zugeordnet. Diskotheken hingegen werden hier nicht genannt. Da die Aufzählung begrifflich so weit ausdifferenziert ist, dass selbst Bier- und Weinwirtschaften und Restaurants mit asiatischem Speiseangebot gesondert aufgeführt werden, muss davon ausgegangen werden, dass die in der Anlage nicht genannten Betriebe oder Betriebsarten auch nicht zu den "zahlreichen geprüften Unternehmen" gehören, die bei der Ermittlung der Richtsätze berücksichtigt worden sind.

    68

    Für diese Annahme spricht auch der Umstand, dass Imbissbetriebe --einschließlich "Asia-Imbiss" und "Döner-Imbiss"-- eine eigene Gewerbeklasse neben den "Gast- und Speisewirtschaften" (RSS 2013) beziehungsweise "Gaststätten" (RSS 2014) bilden, obwohl sie einer Gaststätte noch eher vergleichbar sind als dies bei einer Diskothek der Fall ist. Dasselbe gilt in Bezug auf die in der RSS 2013 gesondert aufgeführten Cafés; auch diese bilden hier eine eigene Gewerbeklasse.

    69

    (b) Den Ausführungen des FG ist zu entnehmen, dass es eine Diskothek einer Schankwirtschaft gleichsetzt. Es hat ausgeführt, die betreffende Gewerbeklasse umfasse auch Gast- und Speisewirtschaften, jedoch lägen bei Getränken die Rohgewinnaufschläge regelmäßig deutlich höher als bei dem Verkauf von Speisen, was es rechtfertige, sich im oberen Bereich der Richtsatzwerte zu bewegen. Es stellt mithin darauf ab, dass in dem Betrieb des Klägers die gleichen Produkte erworben werden konnten wie in Gaststätten, mit der Folge, dass auch die Aufschläge zu vergleichen seien. Diese Überlegung ist jedoch in dieser Form nicht tragfähig. Denn eine Diskothek lässt sich nach den allgemeinen betrieblichen Gegebenheiten nicht ohne weiteres mit einem Restaurant oder einer Gaststätte vergleichen. Das folgt schon daraus, dass der Erwerb von Getränken in einer Diskothek optional ist; man kann sich dort auch aufhalten, ohne Getränke zu konsumieren. Dementsprechend verteilen sich die Einnahmen einer Diskothek auf Eintrittsgelder, Getränkeumsätze und gegebenenfalls weitere Dienstleistungen (wie im Streitfall das Garderobengeld). In einem Restaurant oder einer Gaststätte hingegen ist regelmäßig kein Eintrittsgeld zu entrichten. Dafür wird von den Kunden aber erwartet, dass sie dort Speisen und Getränke konsumieren; die darauf beruhenden Umsätze sind in der Regel die wesentliche Einnahme des betreffenden Betriebs. Diese Unterschiede werden sich im Zweifel auch auf die Preisgestaltung auswirken.

    70

    (c) Nur ergänzend weist der Senat darauf hin, dass in dem von dem FG im ersten Rechtsgang herangezogenen Bericht des Finanzamts Mönchengladbach-Mitte vom 23.05.2017 über Betriebsprüfungen bei Diskotheken (dort unter "III Wirtschaftliche Überprüfung des Umsatzes") ausdrücklich darauf hingewiesen wird, dass die Richtsätze des Gaststättengewerbes auf Diskotheken "nicht übertragbar" seien und sich auch darüber hinaus "ein äußerer Vergleich der Rohgewinnaufschlagsätze" aufgrund der "betriebsspezifischen Besonderheiten" von Diskotheken nicht --das heißt: generell nicht-- anbiete. Lediglich "der innerbetriebliche Vergleich mehrerer Prüfungsjahre innerhalb eines Betriebs" erscheine hier "sinnvoll".

    71

    (2) Das FG-Urteil enthält keine Ausführungen zu den vorstehenden Besonderheiten, die der Anwendung der Richtsätze für Gaststätten auf eine Diskothek entgegenstehen. Damit verstößt die angefochtene Entscheidung gegen das oben (unter II.2.a cc) dargelegte Begründungserfordernis. Insbesondere auch dann, wenn Rohgewinnaufschlagsätze auf Betriebe angewandt werden sollen, die nach den eigenen Begrifflichkeiten der amtlichen Richtsatzsammlung einer bestimmten Gewerbeklasse nicht zugeordnet werden können, bedarf dies einer nachvollziehbaren, auf das konkret geprüfte Unternehmen bezogenen Begründung (so zutreffend auch Oellerich inGosch, AO § 162 Rz 172).

    72

    cc) Schließlich hat das FG auch keinerlei Feststellungen zu der Frage getroffen, ob beziehungsweise inwieweit der Betrieb des Klägers im Hinblick auf seine Organisation und seinen Kundenstamm mit einem Restaurant oder einer Gaststätte gleichgesetzt werden kann. Dabei hatte der Kläger bereits im Klageverfahren im ersten Rechtsgang vorgetragen, dass zu seinem Kundenstamm auch --oder vor allem auch-- Minderjährige gehört hätten und dass er mit besonderen Angeboten gerade um diese Zielgruppe geworben habe. Er sei der einzige Club in Hamburg gewesen, der in den Streitjahren ... habe. Das FA hat dem nicht widersprochen.

    73

    Es liegt nach Ansicht des Senats auf der Hand, dass Finanzkraft und Konsumverhalten von Minderjährigen nicht ohne weiteres mit der Finanzkraft und dem Konsumverhalten eines durchschnittlichen Restaurantbesuchers verglichen werden können. Den diesbezüglichen Vortrag des Klägers hätte daher das FG nicht unberücksichtigt lassen dürfen. Es hätte hierzu Feststellungen treffen und diese --gegebenenfalls-- in seine Würdigung mit einfließen lassen müssen.

    74

    3. Die Vorentscheidung war daher aufzuheben. Die Sache ist nicht spruchreif. Eine eigene Schätzungsbefugnis steht dem BFH --als Rechtsinstanz-- nicht zu ( Senatsurteil vom 19.07.2011 - X R 48/08 , BFH/NV 2011, 2032, Rz 22).

    75

    a) Im dritten Rechtsgang wird das FG zu berücksichtigen haben, dass das FA die Entscheidung des FG im ersten Rechtsgang, die Hinzuschätzung bei den Getränkeumsätzen auf der Grundlage eines Rohgewinnaufschlagsatzes von 300 % betragsmäßig zu beschränken und von weiteren Hinzuschätzungen (Eintrittsgelder und Garderobe) abzusehen, mit geänderten Bescheiden vom 24.01.2020 bereits umgesetzt hat. Diese Bescheide sind gemäß § 121 Satz 1 i.V.m. § 68 Satz 1 FGO Gegenstand des Verfahrens geworden (vgl. Senatsurteil vom 14.12.2022 - X R 24/20 , BFHE 279, 141, BStBl II 2023, 953, Rz 23). Eine Hinzuschätzung im dritten Rechtsgang ist der Höhe nach durch die mit diesen Bescheiden festgesetzte Steuer begrenzt.

    76

    b) Ohne Bindungswirkung weist der Senat auf Folgendes hin:

    77

    aa) Eine Hinzuschätzung auf der Grundlage der amtlichen Richtsatzsammlung wird im Streitfall im Zweifel nicht in Betracht kommen. Auf die Ausführungen unter II.2.b wird Bezug genommen.

    78

    bb) Ein allgemeiner äußerer Betriebsvergleich --das heißt: ohne Rückgriff auf die amtliche Richtsatzsammlung-- wird unter Berücksichtigung der Besonderheiten des Betriebs des Klägers im Zweifel nicht geeignet sein, ein schlüssiges, wirtschaftlich mögliches und vernünftiges Schätzungsergebnis zu begründen. Aus diesem Grund wird das Ermessen des FG bei der Wahl der in Betracht kommenden Schätzungsmethoden voraussichtlich eingeschränkt sein.

    79

    Ermessensgerecht --und naheliegend-- erscheint hier nach bisheriger Erkenntnis die Vornahme einer Nachkalkulation auf der Grundlage des Wareneinsatzes, den der Prüfer für den Zeitraum Januar bis Mai 2013 bereits anhand der gebuchten Eingangsrechnungen und unter Berücksichtigung der in diesem Zeitraum auch tatsächlich gelieferten Getränke ermittelt hat. Denn eine solche Nachkalkulation bietet als die zuverlässigere Schätzungsmethode offensichtlich die größere Gewähr dafür, mit zumutbarem Aufwand das wahrscheinlichere Betriebsergebnis zu erzielen.

    80

    Inwieweit die in dem Bericht des Finanzamts Mönchengladbach-Mitte vom 23.05.2017 über Betriebsprüfungen bei Diskotheken unter "III.1 Kalkulationsmethoden", dort "III.1.4 Rohgewinnaufschläge" genannten Einzelaufschläge auf verschiedene Getränkegruppen (darunter "Cocktails/Mischgetränke" von 414 % bis 593 %) eine Grundlage für eine entsprechende Hinzuschätzung sein können, wird das FG gegebenenfalls prüfen müssen.

    81

    cc) Soweit sich der Kläger auf Freigetränke für Personal und Gäste beruft, die seiner Ansicht nach im Rahmen einer solchen Nachkalkulation berücksichtigt werden müssten, trifft ihn die Feststellungslast. Sollte die Behauptung des FA zutreffen, dass der nachkalkulierte Rohgewinnaufschlagsatz selbst dann, wenn man die von dem FG beanstandeten Erlöse aus dem Verkauf von Cocktails herausrechnete, immer noch deutlich über den vom FG angenommenen 300 % liegt, wird zu prüfen sein, ob die sich aus den Freigetränken ergebenden Umsatzeinbußen bereits durch die Deckelung einer möglichen Hinzuschätzung aufgrund der geänderten Bescheide vom 24.01.2020 (s. oben, unter II.3.a) hinreichend berücksichtigt werden.

    82

    dd) Soweit sich der Kläger schließlich gegen die Höhe der hinzugeschätzten Gewinne wendet und meint, im Streitfall sei wegen der "formellen Aufzeichnungsmängel" allenfalls ein pauschaler Sicherheitszuschlag von 5 % angemessen, weist der Senat darauf hin, dass der Kläger in Anbetracht der festgestellten erheblichen Mängel der Kassenbuchführung gegebenenfalls auch ein grob vereinfachendes Schätzungsergebnis gegen sich gelten lassen muss (s. BFH-Urteil vom 02.02.1982 - VIII R 65/80 , BFHE 135, 158, BStBl II 1982, 409, unter 2.b; Kulosa,DB 2015, 1797, 1798).

    83

    4. Der Senat weist ergänzend und nicht tragend --auch unter Bezugnahme auf seinen Beschluss vom 14.12.2022-- darauf hin, dass erhebliche Zweifel an der Eignung der Richtsatzsammlung in ihrer bisherigen Form als Grundlage für eine Schätzung bestehen.

    84

    Zwar ist der äußere Betriebsvergleich eine in der Betriebsprüfungs- und Schätzungspraxis notwendige --wenn auch grundsätzlich nachrangige-- Schätzungsmethode (dazu unten a). Die Zweifel des Senats beruhen jedoch auf der fehlenden statistischen Repräsentativität der zur Ermittlung der Richtsätze herangezogenen Daten und auf dem von vornherein vorgenommenen Ausschluss bestimmter Gruppen von Betrieben aus der Grundgesamtheit (unten b). Ferner fehlt es sowohl in der Betriebsprüfungspraxis als auch in der instanzgerichtlichen Praxis in Richtsatz-Schätzungsfällen bisher häufig an der erforderlichen nachvollziehbaren Begründung, insbesondere für die Wahl des konkret herangezogenen Richtsatzes aus der weiten, vom BMF für die jeweilige Gewerbeklasse angegebenen Spanne (unten c).

    85

    a) Zunächst ist festzuhalten, dass der Senat auch weiterhin den äußeren Betriebsvergleich für eine in der Praxis der Betriebsprüfung anerkannte und notwendige Schätzungsmethode hält, auf die zurückgegriffen werden darf, wenn andere, tendenziell genauere Methoden unter den besonderen Bedingungen des geprüften Einzelfalls nicht zur Verfügung stehen oder --mit zumutbarem Aufwand-- nicht anwendbar sind.

    86

    Was die tatsächlichen Grundlagen und die organisatorischen Voraussetzungen einer solchen Schätzungsmethode angeht, hat der I. Senat des BFH bereits festgestellt, dass die Finanzverwaltung Datenbanken aufbauen und verwenden darf, auch wenn diese nicht allgemein zugänglich sind, und dass es zulässig ist, Vergleichsdaten mit Hilfe von Datenbanken zu ermitteln ( BFH-Urteil vom 17.10.2001 - I R 103/00 , BFHE 197, 68, BStBl II 2004, 171, unter III.A.2.c cc). Allerdings muss --auch darauf hat der I. Senat des BFH bereits hingewiesen-- die im Einzelfall zu verwendende Datenbank Mindestanforderungen an die Qualität der Datenerfassung erfüllen. Deshalb können die Gerichte gehalten sein, Rückfragen über die Zusammenstellung und Ableitung der anonymisierten Vergleichsdaten zu stellen. Können solche Fragen aus Gründen des Steuergeheimnisses oder aus anderen Gründen nicht beantwortet werden, geht dies zu Lasten des Beweiswertes der Vergleichsdaten ( BFH-Urteil vom 17.10.2001 - I R 103/00 , BFHE 197, 68, BStBl II 2004, 171, unter III.A.2.c cc). Das gilt auch dann, wenn das FA eine Offenlegung von Daten auf der Grundlage von § 21a Abs. 1 Satz 4 des Finanzverwaltungsgesetzes verweigert (vgl. dazu BFH-Urteil vom 09.05.2025 - IX R 1/24 , Höchstrichterliche Finanzrechtsprechung 2025, 750).

    87

    Dementsprechend ist auch die Anwendung einer amtlichen Richtsatzsammlung, die solche Mindestanforderungen an die Qualität der Datenerfassung erfüllt, als taugliche Schätzungsmethode des äußeren Betriebsvergleichs anzusehen.

    88

    b) Es bestehen allerdings aus Sicht des Senats gegenwärtig erhebliche Zweifel an der Eignung der Richtsatzsammlung als Grundlage für eine Schätzung in ihrer bisherigen Ausprägung.

    89

    aa) Diese Zweifel beziehen sich in erster Linie auf die Frage nach der Repräsentativität der zur Ermittlung der Richtsätze herangezogenen Daten. Dabei geht es um das Problem der sogenannten Stichprobenselektivität ("selection bias").

    90

    (1) Bei der Richtsatzsammlung handelt es sich um eine statistische Erhebung in Form einer Teilerhebung auf der Basis von gezogenen Stichproben.

    91

    Ziel einer solchen Stichprobenziehung ist es, einen Repräsentativitätsschluss (Inferenz) zu ermöglichen: Von den ermittelten Parametern der Stichprobe soll auf unbekannte Parameter der Grundgesamtheit geschlossen werden (s. dazu allgemein Hartung, Statistik, 15. Aufl. 2009, S. 269 ff.; Schäfer, Methodenlehre und Statistik, 2016, S. 109 ff.).

    92

    Das Ergebnis einer Stichprobenziehung kann grundsätzlich, da nicht alle Elemente (Merkmalsträger) der sogenannten Grundgesamtheit berücksichtigt werden, immer nur eine Annäherung an die gesuchten, unbekannten Parameter der Grundgesamtheit sein. "Grundgesamtheit" in diesem Sinne sind im Fall der Richtsatzsammlung alle zu einer bestimmten Gewerbeklasse gehörenden inländischen "Normalbetriebe" als Merkmalsträger (vgl. Vorbemerkungen zur amtlichen Richtsatzsammlung für das Kalenderjahr 2014, unter "A) Allgemeines", 3.). Die gesuchten "unbekannten Parameter" sind die einzelnen Richtsätze, die aus einem unteren und oberen Rahmensatz sowie einem Mittelsatz bestehen.

    93

    (2) Eine Stichprobe ist repräsentativ, wenn sie bezüglich der statistischen Merkmalsausprägungen die Grundgesamtheit widerspiegelt, wenn also die Zusammensetzung der Merkmalsträger der Stichprobe im Hinblick auf alle für die Erhebung relevanten Merkmale der Zusammensetzung der Merkmalsträger der Grundgesamtheit entspricht. Faktoren, die die Repräsentativität beeinflussen, sind die Größe der Stichprobe --je größer die Stichprobe, desto geringer die Abweichung-- und ihre Zusammensetzung (Eid/Gollwitzer/Schmitt, Statistik und Forschungsmethoden, 4. Aufl. 2015, S. 290 f.; Schäfer, Methodenlehre und Statistik, 2016, S. 30 f. und 109 ff.).

    94

    (3) Da bei der Stichprobenziehung die Messung auf eine Auswahl von Merkmalsträgern beschränkt wird, können verschiedene Probleme auftreten, die bei der Gestaltung der Stichprobenauswahl berücksichtigt werden müssen. Zu diesen Problemen gehört die sogenannte Stichprobenselektivität ("selection bias").

    95

    Stichprobenselektivität liegt dem Statistischen Bundesamt zufolge dann vor, wenn bei der Stichprobenauswahl bestimmte Merkmalsträger bevorzugt werden oder mit größerer Wahrscheinlichkeit in die Stichprobe gelangen als andere. Das Problem der Stichprobenselektivität tritt immer dann auf, wenn die Auswahlwahrscheinlichkeit mit dem Untersuchungsmerkmal zusammenhängt. Aufgrund der Stichprobenselektivität können die Stichprobenergebnisse systematisch verzerrt und damit ungenau sein (Quelle [zuletzt aufgerufen am 01.08.2025]:https://service.destatis.de/eLearning/modul10/lm_pg_1442.html; s.a. Eid/Gollwitzer/Schmitt, Statistik und Forschungsmethoden, 4. Aufl. 2015, S. 231).

    96

    (4) Solchen systematischen Verzerrungen wirkt man durch die Form der Stichprobenziehung entgegen. Unterschieden wird zwischen zufallsgesteuerten und nichtzufallsgesteuerten Auswahlverfahren (Leonhart, Lehrbuch Statistik, 5. Aufl. 2022, S. 175 ff.).

    97

    Eine Zufallsauswahl liegt vor, wenn Merkmalsträger nach einem Zufallsverfahren (zum Beispiel Losverfahren) aus der Grundgesamtheit ausgewählt werden. Es muss dabei gewährleistet sein, dass jeder Merkmalsträger der Grundgesamtheit die gleiche Wahrscheinlichkeit hat, in der Stichprobe zu landen. Das Verfahren zur Stichprobenziehung muss hierfür exakt beschrieben und konsequent umgesetzt werden; nur dann kann von einer unverzerrten Zufallsstichprobe ausgegangen werden (Leonhart, Lehrbuch Statistik, 5. Aufl. 2022, S. 174).

    98

    Sind diese Voraussetzungen erfüllt und hat die Stichprobe eine bestimmte Mindestgröße, kann damit das Problem der Stichprobenselektivität nahezu vermieden werden. Zufallsstichproben sind daher repräsentative Stichproben; das heißt, sie erlauben aus wahrscheinlichkeitstheoretischer Sicht den Schluss auf die Grundgesamtheit (s. Eid/Gollwitzer/Schmitt, Statistik und Forschungsmethoden, 4. Aufl. 2015, S. 290).

    99

    Außerdem ist es möglich, die Größe von Zufallsfehlern --sogenannte Stichprobenfehler-- anhand von statistischen Methoden quantitativ zu messen und unter bestimmten Voraussetzungen sogar vorab einzuschätzen. Auf diese Weise lässt sich auch die benötigte Mindestgröße einer Stichprobe in der Planungsphase der Erhebung eingrenzen (Hartung, Statistik, 15. Aufl. 2009, S. 238 ff.; Leonhart, Lehrbuch Statistik, 5. Aufl. 2022, S. 219 ff. und 226 f.; Eid/Gollwitzer/Schmitt, Statistik und Forschungsmethoden, 4. Aufl. 2015, S. 230 ff. und 239 ff.).

    100

    Demgegenüber ist die Repräsentativität der Stichprobe im Fall einer nichtzufallsgesteuerten Auswahl, insbesondere bei einer bewussten Auswahl, grundsätzlich nicht gewährleistet und es besteht auch keine Möglichkeit, die Größe des Zufallsfehlers zu berechnen (Leonhart, Lehrbuch Statistik, 5. Aufl. 2022, S. 178 f.).

    101

    (5) Das BMF hat das Problem der Stichprobenselektivität erkannt. Es bezieht sich in seiner Stellungnahme vom 18.07.2023 im Zusammenhang mit der Frage, wie die Repräsentativität der zur Ermittlung der Richtsätze herangezogenen Daten sichergestellt werden kann, auf die gutachtliche Stellungnahme des Betriebsprüfers Dipl.-Math. Mühlenbruch der Konzernbetriebsprüfungsstelle Köln zur Festlegung der Richtsatz-Rahmensätze vom 12.04.1985.

    102

    In dieser gutachtlichen Stellungnahme wird unter "II. Sicherheit der Wahrscheinlichkeitsaussage über die Richtsätze" (auf S. 6) abschließend festgehalten: "Bei allen vorstehenden Ausführungen wurde unterstellt, daß die prüfenden Stellen die für Zwecke der Richtsätze ausgewählten Betriebe entsprechend den Grundsätzen der jährlich herausgegebenen Richtsatzverfügungen bestimmen und es sich insofern um eine Zufallsstichprobe handelt. Sollte dies nicht der Fall sein, wäre eine mathematisch-statistische Aussage über die Sicherheitswahrscheinlichkeit nicht möglich; darüber hinaus könnten die Richtsätze nicht für sich in Anspruch nehmen, für die einzelnen Branchen einen repräsentativen Querschnitt der jeweiligen Gewerbeklasse zu bieten."

    103

    In diesem Sinne weist auch das BMF selbst in seiner Stellungnahme vom 18.07.2023 (auf S. 3, letzter Absatz) darauf hin, dass die auf der Grundlage von Stichprobenergebnissen getroffenen Aussagen auf der Verwendung von "echten Zufallsstichproben" beruhen müssten.

    104

    (6) Damit wird nach Ansicht des Senats hinreichend deutlich, dass die Tauglichkeit der Richtsatzsammlung als Instrument des äußeren Betriebsvergleichs davon abhängt, ob die Voraussetzung einer Zufallsauswahl erfüllt ist. Die von der Richtsatzkommission ermittelten Rohgewinnaufschlagsätze können nur dann für die jeweilige Gewerbeklasse repräsentativ sein, wenn die Auswahl der sogenannten Normalbetriebe, deren Ergebnisse in die Ermittlung der Richtsätze eingeflossen sind, unter statistischen Gesichtspunkten den Ansprüchen einer "echten" Zufallsauswahl gerecht wird.

    105

    (7) Entsprechende Darlegungen, die den Schluss erlauben würden, dass die in der gutachtlichen Stellungnahme vom 12.04.1985 gesetzte Prämisse einer Zufallsstichprobe beziehungsweise einer "echten" Zufallsauswahl im mathematisch-statistischen Sinne in Bezug auf die amtliche Richtsatzsammlung erfüllt ist, lassen sich den Ausführungen des FA und des BMF nicht entnehmen.

    106

    (a) Das BMF hat nicht dargelegt, auf welche Weise gewährleistet wird, dass die Voraussetzungen einer Zufallsauswahl bei der Ermittlung der Richtsätze auch tatsächlich erfüllt werden. Das BMF trägt insoweit nur vor, dass jährlich circa 5 000 Prüfungsergebnisse aus allen Bundesländern in die Ermittlung der Richtsätze einflössen, die Fälle "dezentral durch die Länder" ausgewählt würden und sich die Anzahl der zu liefernden Ergebnisse je Bundesland in Abhängigkeit von der Einwohnerzahl ergebe. Weitere Ausführungen zum Auswahlverfahren und insbesondere zur Repräsentativität der herangezogenen Daten hat das BMF nicht gemacht.

    107

    (b) Auch in der mündlichen Verhandlung konnte dieser Punkt nicht hinreichend aufgeklärt werden.

    108

    Der als Beistand des BMF zugelassene A hat nachvollziehbar geschildert, dass zwar die Richtsatzkommission, die die Anzahl der für die Erstellung der Richtsätze notwendigen Betriebe vorgebe und auf die Finanzämter verteile, auf das Erfordernis einer Zufallsauswahl hinweise. Ob dieser Hinweis allerdings von den Finanzämtern befolgt werde, entziehe sich dem Kenntnisstand der Kommission. Geeignet sei der (in der Richtsatzsammlung beschriebene) "Normalbetrieb". Ob ein solcher vorliege, entschieden die Finanzämter vor Ort.

    109

    Auf die Bitte des Senats, näher zu beschreiben, wie die Betriebe, deren Kennzahlen in die Richtsatzsammlung eingingen, bestimmt würden, haben der Beistand und das FA ausgeführt, es handele sich dabei um Betriebe, bei denen auf Grundlage der in § 193 AO genannten Kriterien ohnehin Außenprüfungen durchgeführt würden. Ein Teil der Außenprüfungen beruhe auf Meldungen durch die Veranlagungsbezirke, ein anderer Teil werde nach Zufallskriterien vom Computer ausgewählt. Auch bei diesen vom Computer zur Prüfung vorgeschlagenen Betrieben werde aber in einem zweiten Schritt personell geprüft, ob der Betrieb prüfungswürdig sei. Wenn dies verneint werde, werde der Betrieb nicht geprüft und gehe also auch nicht in die Richtsatzsammlung ein.

    110

    (c) Damit beruht die Heranziehung der konkreten Betriebe, deren Daten in die Richtsatzsammlung eingehen, nicht auf einer Zufallsauswahl, was für die Annahme statistischer Repräsentativität aber erforderlich wäre. Denn die Kriterien des § 193 AO sind nicht die einer Zufallsauswahl. Erst recht gilt dies für das im zweiten Schritt zur Anwendung kommende Kriterium der "Prüfungswürdigkeit", das zwar für Zwecke der Außenprüfung sinnvoll ist, eine Stichprobe aber notwendig verzerrt. Auch die Vorgabe, dass nur "Normalbetriebe" im Sinne der Richtsatzsammlung für die Erstellung der Richtsätze in Frage kommen, führt dazu, dass das jeweilige Finanzamt entscheiden muss, welche Betriebe zu diesem Zweck "geeignet" sind. Hinzu kommt, dass es auch an der erforderlichen exakten Beschreibung und an der Gewährleistung einer konsequenten Umsetzung des Verfahrens der (Zufalls-)Stichprobenziehung (dazu oben (4)) fehlt.

    111

    (8) Jedenfalls im Ergebnis bestätigt wird dieser Befund auch durch die Antwort der Bundesregierung vom 11.09.2018 auf die Kleine Anfrage vom 27.08.2018 (BTDrucks 19/4238, S. 3, zu Frage 4 und 5). Darin wird in Bezug auf die Auswahl der zur Durchführung einer Richtsatzprüfung vorgesehenen Betriebe ebenfalls auf die allgemeinen Vorschriften zur Außenprüfung nach §§ 193 ff. AO verwiesen und dazu ausgeführt, die Außenprüfung stelle kein frei verfügbares Prüfungsinstrument dar. Eine besondere Auswahl von Betrieben mit der Zielstellung, die Festsetzung der Richtsätze in eine bestimmte Richtung zu beeinflussen, erfolge nicht und widerspräche auch dem Gesetzesauftrag, dass Finanzbehörden die Steuern nach Maßgabe der Gesetze gleichmäßig festzusetzen und zu erheben hätten. Damit seien zum Beispiel Betriebsprüfungen zum ausschließlichen Zweck von Richtsatzermittlungen nicht vereinbar.

    112

    Eine Auswahl von Betrieben nach Maßgabe der §§ 193 ff. AO ist aber, wie bereits dargelegt, keine Zufallsauswahl, sondern eine bewusste Auswahl, die sich an dem vornehmlichen Ziel der Außenprüfung orientiert --und orientieren muss--, Steuergerechtigkeit durch einen gerechten Vollzug der Steuergesetze zu verwirklichen (vgl. Senatsurteil vom 02.10.1991 - X R 89/89 , BFHE 166, 105, BStBl II 1992, 220, unter 2.b; s.a. Seer inTipke/Kruse, § 193 AO Rz 40, m.w.N.).

    113

    (9) Wenn somit aber die Finanzverwaltung einerseits einräumt, dass eine Richtsatzsammlung nur dann statistisch valide Aussagen treffen kann, wenn ihre Daten auf der Grundlage einer Stichprobenziehung in Form einer "echten" Zufallsauswahl gewonnen worden sind, diese Voraussetzung aber tatsächlich nicht erfüllt ist, weil schon das Verfahren zur Stichprobenziehung weder exakt beschrieben noch konsequent umgesetzt worden ist und darüber hinaus eine Auswahl prüfungswürdiger und "geeigneter Normalbetriebe" vorgenommen wird, die eben keine Zufallsauswahl mehr darstellt, dann gibt es --nach derzeitigem Stand-- keine Gewähr dafür, dass die in der amtlichen Richtsatzsammlung enthaltenen Daten für die jeweilige Gewerbeklasse repräsentativ sind. Folglich ist die amtliche Richtsatzsammlung in ihrer gegenwärtigen Form kein taugliches Instrument für eine Schätzung nach § 162 AO im Wege des äußeren Betriebsvergleichs.

    114

    bb) Zweifel hat der Senat des Weiteren in Bezug auf den Umstand, dass die Ergebnisse von Verlustbetrieben bei der Ermittlung der Richtsätze von vornherein ausgeschlossen werden. Der Senat bezieht sich insoweit auf "echte" Verluste, also solche, die nach Durchführung einer Außenprüfung von der Finanzverwaltung anerkannt werden.

    115

    (1) Warum Betriebe allein aufgrund der Entstehung von Verlusten a priori aus der Grundgesamtheit ausgeschlossen werden, auch wenn sonst keine außergewöhnlichen betrieblichen Verhältnisse vorliegen, die die Repräsentativität eines solchen Betriebs in Frage stellen, erschließt sich dem Senat nicht. Denn auch in einem "normalen" Betrieb können Verluste entstehen. Die gezielte Herausnahme von Verlustbetrieben ist ein weiterer Gesichtspunkt, der der Annahme einer unverzerrten Zufallsstichprobe entgegensteht, da sich als Folge notwendigerweise die Richtsatzspanne nach oben verschiebt. Wie groß die Auswirkung dieser nach Ansicht des Senats fehlerhaften Verengung der Grundgesamtheit ist, lässt sich allerdings ohne konkrete Zahlen zu den ausgeschiedenen Fällen nicht einschätzen.

    116

    (2) Ungeachtet dessen hält der Senat das Argument des BMF, dass eine Berücksichtigung von Verlustbetrieben bei den unteren Rahmensätzen zu negativen Werten führen könnte, die dann gegebenenfalls zu negativen Hinzuschätzungsbeträgen führten, jedenfalls in Bezug auf den Rohgewinnaufschlagsatz, dem in der Praxis der Außenprüfung wohl mit Abstand die größte Bedeutung zukommt, für unzutreffend. Denn in aller Regel beruhen Verluste nicht darauf, dass Waren, wie zum Beispiel Speisen und Getränke, zu Preisen unterhalb des Einkaufspreises der Zutaten an die Kunden abgegeben werden, sondern darauf, dass die sonstigen Kosten (vor allem Miete und Personal) den Rohgewinn übersteigen. Es spricht daher auch aus systematischen Gründen nichts dagegen, die, wenn auch möglicherweise geringeren, so doch im Zweifel gleichwohl positiven Rohgewinnaufschlagsätze von Verlustbetrieben in die Richtsatzsammlung mit aufzunehmen.

    117

    (3) Dabei ist auch zu berücksichtigen, dass ohnehin bei der Ermittlung der Richtsätze die jeweils 10 % der Betriebe mit den höchsten und niedrigsten Rohgewinnaufschlagsätzen außer Betracht bleiben (s. Antwort der Bundesregierung vom 11.09.2018 auf die Kleine Anfrage vom 27.08.2018, BTDrucks 19/4238, S. 3 [unter 7. und 8.]). Der Senat geht davon aus, dass damit im Zweifel bereits sämtliche --oder nahezu sämtliche-- Betriebe ausgeschieden würden, bei denen sich auch nach Durchführung einer Außenprüfung noch ein Verlust ergibt. Die doppelte Kappung des unteren Rahmens der Richtsätze durch die Nichtberücksichtigung von Verlustbetrieben und zusätzlich das Außer-Ansatz-Lassen der danach verbleibenden untersten 10 % führt nach gegenwärtiger Ansicht des Senats zu einer weiteren Verfälschung der ermittelten Werte.

    118

    (4) Sollte es der Finanzverwaltung hingegen darum gehen, typischerweise Betriebe mit Anlaufverlusten nicht in die Richtsätze mit einzubeziehen, weil man die Anlaufphase als "außergewöhnlichen betrieblichen Umstand" ansehen möchte, müssten konsequenterweise sämtliche Betriebe, die sich in der Anlaufphase befinden, ungeachtet ihres Betriebsergebnisses ausgesondert werden. Es erscheint dem Senat widersprüchlich, zwar Anlaufverluste auszuscheiden, Anlaufgewinne aber bei der Ermittlung der Richtsätze zu berücksichtigen.

    119

    Wenn alle in der Anlaufphase befindlichen Betriebe ausgeschieden werden, was der Senat für zulässig hielte, müsste daraus dann aber auch folgen, dass die Richtsatzsammlung für Betriebe in der Anlaufphase keine geeignete Schätzungsgrundlage ist.

    120

    cc) Für unbedenklich hält der Senat dagegen den Umstand, dass die Ergebnisse von "Großbetrieben" einerseits und von Betrieben mit einem Jahresumsatz von weniger als 10.000 € andererseits (von der Finanzverwaltung als "Nebenerwerbsbetriebe" bezeichnet) nicht bei der Ermittlung der Richtsätze berücksichtigt werden. Denn bei einer typisierenden Betrachtung dürften diese Betriebe nicht repräsentativ für den sogenannten Normalbetrieb sein.

    121

    dd) Im Grundsatz ebenfalls unbedenklich ist nach Ansicht des Senats, dass "Betriebe mit außergewöhnlichen betrieblichen oder persönlichen Verhältnissen" ausgeschieden werden, da auch solche Betriebe schon dieser Beschreibung nach nicht repräsentativ für die Grundgesamtheit sind. Allerdings müsste die Finanzverwaltung, um willkürliche, nicht nachvollziehbare oder rein subjektive Entscheidungen der örtlichen Ebene bei der Auswahl von Betrieben für die Ermittlung neuer Richtsatzdaten zu vermeiden, näher definieren oder zumindest typisierend umschreiben, was sie mit "außergewöhnlichen Verhältnissen" meint.

    122

    Darüber hinaus wäre zu beachten, dass, wenn Betriebe mit außergewöhnlichen Verhältnissen von vornherein nicht in die Richtsatzsammlung eingehen, jeder Anwendung der Richtsatzsammlung im Einzelfall ein Prüfungsschritt vorangestellt werden müsste, in dem beurteilt wird, ob es sich bei dem konkret geprüften Betrieb um einen Betrieb mit außergewöhnlichen Verhältnissen handelt. Denn ein solcher Betrieb fällt von vornherein nicht in die Grundgesamtheit, aus der die Daten der Richtsatzsammlung gewonnen werden. Folglich dürften auf derartige Betriebe die Richtsätze nicht angewendet werden.

    123

    ee) Schließlich ist nach Ansicht des Senats auch unbedenklich, dass Veränderungen von Prüfungsergebnissen aufgrund von Rechtsbehelfsverfahren unberücksichtigt bleiben. Zwar begründet dies nach Ansicht des Senats abstrakt einen Mangel der Richtsatzsammlung, weil in der Folge tendenziell überhöhte Werte bei der Ermittlung der Richtsätze berücksichtigt werden. Das Interesse des BMF an einer zeitnahen Bereitstellung der jeweiligen Richtsätze ist allerdings vorrangig. Jedoch wäre es nach Ansicht des Senats gegebenenfalls geboten, zur pauschalen Berücksichtigung des Umstands, dass es in einem bestimmten Prozentsatz von Fällen in einem späteren Einspruchs- oder Klageverfahren zu einer Herabsetzung der von der Außenprüfung angenommenen Gewinne kommt, einen Abschlag von den ohne Berücksichtigung dieses Umstands ermittelten Werten der Richtsatzsammlung vorzunehmen.

    124

    c) Im Übrigen setzt die Rechtmäßigkeit einer Schätzung, die auf die Richtsatzsammlung gestützt wird, nach Ansicht des Senats voraus, dass die Anwendung der Richtsätze im Einzelfall nachvollziehbar begründet wird.

    125

    aa) Dies betrifft zunächst die Bestimmung des im konkreten Fall maßgeblichen Richtsatzwertes aus den mitunter sehr weiten Spannen der Richtsätze.

    126

    So betragen beispielsweise die Rohgewinnaufschlagsätze für Hotels, Gasthöfe und Pensionen nach der RSS 2014 zwischen 257 % und 1329 %, für Bestattungsunternehmen zwischen 233 % und 1150 %, für Kosmetiksalons zwischen 150 % und 1011 % und für Telekommunikationsgeräte und Mobiltelefone sogar zwischen 43 % und 1900 %. Ganz besonders in Branchen mit einer derart weiten Richtsatzspanne, aber auch im Übrigen, muss erkennbar und nachvollziehbar sein, dass das FG die Besonderheiten des Einzelfalls in den Blick genommen hat; dies erfordert eine nachvollziehbare Begründung für die Wahl des konkret herangezogenen Wertes unter Auseinandersetzung mit den erkennbaren betrieblichen Besonderheiten.

    127

    In den Richtsatzsammlungen wird insoweit nur ausgeführt, dass die Anwendung der Mittelsätze "im allgemeinen" zu einem Ergebnis führe, das "mit der größten Wahrscheinlichkeit den tatsächlichen Verhältnissen am nächsten komme" (vgl. Tz. 10.2.1 der Vorbemerkungen zur Richtsatzsammlung). Als statistische Aussage mag das zutreffend sein. Die statistische Wahrscheinlichkeit für ein bestimmtes Ereignis sagt aber prinzipiell nichts darüber aus, ob das Ereignis auch wirklich eingetreten ist (so zutreffend Gräber/Ratschow, Finanzgerichtsordnung, 9. Aufl., § 96 Rz 83). Bezogen auf die Richtsatzsammlung bedeutet das, dass der Mittelsatz der Rohgewinnaufschlagsätze einer bestimmten Gewerbeklasse noch keine konkrete Aussage über den zu prüfenden Betrieb zulässt. Ob die Anwendung des betreffenden Mittelsatzes den Verhältnissen des zu prüfenden Betriebs gerecht wird, muss erst noch anhand der tatsächlichen Verhältnisse geprüft und begründet werden.

    128

    Nach Ansicht des Senats ist hier ein zweistufiges Vorgehen sinnvoll: In einem ersten Schritt sollte die weite Spanne der Rahmensätze unter Heranziehung der tatsächlichen Verhältnisse des zu schätzenden Betriebs (zum Beispiel Lage in einem Hochpreis- oder Niedrigpreisgebiet, Kundenkreis, sonstige Besonderheiten) zu einem schmaleren, im konkreten Streitfall in Betracht kommenden Bereich verengt werden. In einem zweiten Schritt muss der Rechtsanwender sich dann auf einen bestimmten, nachvollziehbar begründbaren Wert aus dieser verengten Spanne festlegen.

    129

    bb) Auch Besonderheiten, die sich aus dem Preisniveau am Standort des geprüften Betriebs ergeben, müssten nach Auffassung des Senats bei einem Rückgriff auf die Richtsätze der amtlichen Richtsatzsammlung berücksichtigt werden.

    130

    Das BMF vertritt hierzu die Auffassung, dass regionale Unterschiede bei den fixen Betriebskosten der Festlegung bundeseinheitlicher Richtsätze nicht entgegenstehen, da höhere Fixkosten --zum Beispiel Raum- und Personalkosten-gegebenenfalls durch höhere Verkaufspreise an die Kunden weitergegeben würden. Die Aufschlagsätze veränderten sich dadurch, wenn überhaupt, nur marginal.

    131

    Diese Aussage ist so nicht schlüssig. Gerade in der Gastronomie, bei der in der Praxis der Betriebsprüfung Schätzungen anhand der Rohgewinnaufschlagsätze wohl am häufigsten vorkommen, unterscheiden sich die Einkaufspreise für Getränke und für die Zutaten der zubereiteten Speisen bundesweit nicht erheblich. Demgegenüber sind die Verkaufspreise für Getränke und Speisen in strukturschwachen Niedrigpreisregionen ganz erheblich niedriger als in wirtschaftsstarken Hochpreisregionen. Dies ist eine betriebswirtschaftliche Notwendigkeit, da die Fixkosten --vor allem die auch vom BMF angeführten Raum- und Personalkosten-- in Hochpreisregionen deutlich höher sind als in Niedrigpreisregionen. Diese höheren Fixkosten können aber nur über einen höheren Rohgewinnaufschlag finanziert werden. Geht man von bundesweit nur unwesentlich variierenden Einkaufspreisen aus, folgt daraus, dass Betriebe in Hochpreisregionen --typischerweise-- einen deutlich höheren Rohgewinnaufschlagsatz haben werden als Betriebe in Niedrigpreisregionen.

    132

    Dieser Befund spricht nicht gegen die Schätzungsmethode unter Verwendung der Richtsatzsammlung als solche, zumal diese --wie bereits dargestellt-- sehr weite Spannen aufweist. Allerdings setzt die Bestimmung eines sachgerechten Wertes innerhalb der weiten Spanne der Rohgewinnaufschlagsätze eben notwendig auch eine Auseinandersetzung mit der Frage voraus, ob nach den konkreten Gegebenheiten des geprüften Betriebs, zu denen eben auch die Lage in einer Hochpreis- oder Niedrigpreisregion gehören kann, eher hohe oder eher niedrige Rohgewinnaufschlagsätze zu erwarten sind. Im Steuerstrafrecht jedenfalls ist bereits anerkannt, dass bei Anwendung der Richtsatzsammlung die örtlichen Verhältnisse zu berücksichtigen sind (vgl. BGH-Beschluss vom 11.03.2021 - 1 StR 521/20 , NStZ 2021, 743, Rz 14).

    133

    cc) Schließlich müssen bei der Anwendung der Richtsatzsammlung auch die Angaben der Finanzverwaltung zu der sogenannten Sicherheitswahrscheinlichkeit der mit der Richtsatzsammlung getroffenen statistischen Aussagen berücksichtigt werden.

    134

    (1) Das BMF hat ausgeführt, die unteren und oberen Rahmensätze würden jeweils so festgelegt, dass etwa 80 % der geprüften Ergebnisse innerhalb des Rahmens lägen. Durch diese Festlegung werde gewährleistet, dass man bei einer Stichprobe von beispielsweise 100 Fällen mit einer hohen Sicherheitswahrscheinlichkeit davon ausgehen könne, dass mindestens 70 % aller Betriebsergebnisse in diesem Rahmen lägen. Der Rahmen sei konservativ geschätzt, so dass die Sicherheitswahrscheinlichkeit bei ungefähr 97 % liege.

    135

    (2) Dabei ist zunächst noch einmal festzuhalten, dass insbesondere auch diese Aussagen mit der Prämisse verknüpft sind, dass die in der Richtsatzsammlung enthaltenen Daten auf der Grundlage einer Stichprobenziehung in Form einer "echten" Zufallsauswahl gewonnen worden sind, wobei nach derzeitigem Stand nicht festgestellt werden kann, dass die amtlichen Richtsatzsammlungen diese Voraussetzung erfüllen. Die Aussagen des BMF beziehen sich folglich auf eine "taugliche" Richtsatzsammlung.

    136

    (3) Auch bei der Anwendung einer solchen "tauglichen", also tatsächlich repräsentativen Richtsatzsammlung muss beachtet werden, dass trotz der mitunter sehr weiten Spannen der Richtsätze mit einer Sicherheitswahrscheinlichkeit von 97 % lediglich 70 von 100 geprüften Betrieben in diesem Bereich liegen werden, die übrigen 30 Betriebe hingegen nicht.

    137

    Dies führt noch einmal vor Augen, dass es sich bei der Richtsatzschätzung um eine sehr ungenaue Schätzungsmethode handelt, und es macht deutlich, wie wichtig es ist, zu prüfen, ob die Richtsatzschätzung im jeweiligen Einzelfall überhaupt eine geeignete Schätzungsmethode darstellt oder ob der geprüfte Betrieb Besonderheiten aufweist, die dafür sprechen, ihn eher den 30 % "Ausreißerbetrieben" zuzuordnen.

    138

    Damit unterstreichen diese Zahlen den Vorrang des inneren Betriebsvergleichs als der zuverlässigeren Schätzungsmethode (s. oben, unter II.2.a aa (2) (c)). Eine Nachkalkulation wird auch dann, wenn gewisse Rest-Unsicherheiten verbleiben, dem Ziel einer Schätzung, die Besteuerungsgrundlagen möglichst realitätsgerecht zu erfassen (s. oben, unter II.2.a aa (2) (a)), im Zweifel immer noch näherkommen als eine Richtsatzschätzung.

    139

    (4) Für die Richtsatzschätzung bleiben demzufolge nach pflichtgemäßem Ermessen ( § 5 AO - s. oben, unter II.2.a aa (2)) im Grunde nur noch solche Betriebe, bei denen die vorhandenen Aufzeichnungen derart lückenhaft oder inhaltlich zweifelhaft sind, dass sie bei zumutbarem Aufwand noch als Grundlage für einen --auch mit Restunsicherheiten behafteten-- inneren Betriebsvergleich ausscheiden.

    140

    5. Die Übertragung der Kostenentscheidung beruht auf § 143 Abs. 2 FGO .

    Vorschriften§ 122 Abs. 2 der Finanzgerichtsordnung (FGO), § 30 der Abgabenordnung, § 126 Abs. 3 Satz 1 Nr. 2 FGO, § 162 Abs. 1 Satz 1 AO, § 96 Abs. 1 Satz 1 Halbsatz 2 FGO, § 162 AO, § 162 Abs. 2 Satz 1 AO, § 90 Abs. 2 AO, § 162 Abs. 2 Satz 2 AO, § 158 Abs. 2 AO, § 158 AO, § 93 Abs. 7 Satz 1 Nr. 5 AO, §§ 140 bis 148 AO, § 146 Abs. 1 Satz 2 AO, § 162 Abs. 1 Satz 2 AO, § 96 Abs. 1 Satz 1 FGO, § 5 AO, § 96 Abs. 1 Satz 1 Halbsatz 1 FGO, § 68 Satz 1 FGO, § 21a Abs. 1 Satz 4 des Finanzverwaltungsgesetzes, § 193 AO, §§ 193 ff. AO, § 143 Abs. 2 FGO