Como ya se ha visto a lo largo de la historia de la teoría de conjuntos, no toda formula del lenguaje de la lógica de predicados de primer orden lleva a objetos matemáticos que podamos considerar en la teoría conjuntista, sin ir muy lejos con la formula para definir al conjunto $x = \{ a \mid a \notin a \}$ nos lleva a la paradoja de Russell. Pero esto solo sucede si $x$ es un conjunto, si dijeramos que $x$ no está "disponible" en esta etapa del proceso de construcción, es decir, si decimos que $x \in x$ nunca se da ya no habría problema.
Pero esto arroja una pregunta obvia, si $x$ como tal no está en consideración, ¿Dónde "viven" los $a$?, es decir, si el conjunto es fundamentalmente distinto de sus elementos, ¿de dónde puedo obtener dichos elementos para empezar?, esto parece indicarnos que la teoría de conjuntos tal como la entendemos es naturalmente jerárquica, pues partiendo de una colección inical $M_0$ podemos obtener los elementos de los conuntos que formarán otra etapa $M_1$ y con esto poder seguir construyendo una jerarquía.
En el caso de la jerarquía de Von Neumann (V) comenzaremos con la identificación del primer nivel de la jerarquía dado por: $$V_0 = \emptyset $$. Para construir el siguiente nivel deberemos darnos cuenta de que cada nivel de la misma estará caraterizada por un ordinal $\alpha$ y que además todos los elementos del nivel anterior deberán estar contenidos por $\bigcup_{\beta < \alpha} V_\alpha$. Para ser mas claros con este punto veamos como debería cambiar la situación entre los niveles $V_{\alpha + 1} y V_\alpha $: una posibilidad sería pensar en todos aquellos conjuntos que se pueden expresar mediante una fórmula de la lógica de primer orden, y si bien no es mala idea, estamos adoptando implicitamente al Axioma de constructibilidad, lo cuál no es lo más objetivo; por otro lado, si decimos que $V_{\alpha +1}$ está compuesto por todos los posibles subconjuntos que están en $V_\alpha$ estamos adoptando el Axioma del conjunto de partes, y definimos $$V_{\alpha +1} = \wp (V_\alpha) $$, y en caso de estar frente a un ordinal límite tomaremos la misma definición que en este caso particular será $$V_\lambda = \bigcup_{\beta < \lambda} V_{\beta}$$
Con esto podemos decir cosas importantes, primero, que al usar el conjunto de partes obtenemos objetos unicamente matemáticos y segundo, todo conjunto $x$ pertenece a algún $V_\alpha$. Esto nos permite definir lajerarquia hereditaria de Von Neumann de manera intuitiva como $V = \bigcup_{\alpha} V_\alpha$, para ver que está bien fundamentada esta jerarquía usaremos el Axioma de fundación:
Si $V$ no esta bien fundada es porque existe un $x_0 \neq \emptyset$ tal que $x_0 \subset x_0$, lo cuál contradice directamente el axioma de fundación, pues $x_0$ tendría un elemento que no es subconjunto de $x_0$.
Para la definición de $V$ usamos los siguiente axiomas: Existencia del conjunto vacío, Uniones, Reemplazo, Partes, Separación y Fundamentación, en particular este último es equivalente a la definición dada de $V$.
Teoremas importantes sobre la jerarquía
1) V no es un conjunto sino una clase propia.
2) Si $\alpha < \omega$ entonces $V_\alpha$ es finito.
3) $(V_\omega , \in )$ no satisface el axioma del infinito.
4) Si $x \in y \in V_\alpha $ entonces $x \in V_\alpha$ con $\alpha < \omega + \omega$. Este teorema nos dice que es transitivo, y es más general pero es más fácil de verificar hasta esta escala.
Relación con el universo constructible
Cuando definimos la jerarquia de Von Neumann tomamos por cierto el axioma del conjunto de partes sin realmente definir o acotar que es tomar el conjunto de partes de un cierto conjunto, esto nos permite ir por otro camino, no usar explicitamente este axioma; si hacemos esto tendremos que modificar unicamente la definición del nivel $\alpha + 1$, y dejaremos el resto intacato, para ello construiremos a dicho nivel siempre que ya tengamos el nivel $\alpha$ de la sigueinte manera:
X pertenecerá a este nivel si y solo si existe una formula del lenguaje de la teoría de conjuntos $\phi$ y los elementos $a_1 ,..., a_m \in L_{\alpha}$ representados en $\phi$ son tales que X es la colección de todo $x \in L_{\alpha}$ y $\phi (x)$ es verdadero.
Así, definimos la jerarquía o universo constructible como $$L = \bigcup_{\alpha \in On} L_\alpha $$ con las condiciones: $$L_0 = \emptyset $$ $$L_{\lambda} = \bigcup_{\alpha < \lambda} L_{\alpha}$$ $$X \in L_{\alpha +1} \iff \bigcup_{x \in X} \{ x \in L_\alpha : \phi(x) \} $$
Este conjunto tiene algunas propiedades interesantes, entre ellas:
1) Si $\alpha \leq \beta$ entonces $L_\alpha \subseteq L_\beta$
2) $L_\alpha$ es transitivo.
3) $ \lvert L_\alpha \rvert = \lvert \alpha \rvert $
Esta última nos lleva al caso particular $\lvert L_{\omega +1} \rvert = \aleph_0$ mientras que como $\wp (\omega) \subseteq V_{\omega +1}$ tenemos que $\lvert V_{\omega +1} \rvert > \aleph_0$; esto parecería indicarnos que $L$ "crece" más lento que $V$, pero ¿en algún momento se alcanzan?
Si bien dijimos que podiamos llegar a $L$ ignorando el axioma del conjunto de partes, lo cierto es que podemos construirla en base a la recursión sobre los ordinales, y para ello podemos usar la teoría de Zermelo - Fraenkel para generarla; para ello usaremos la función $Def(x)$ la cuál asigna a todo $x \in V$ el conjunto de los subconjuntos de $x$ que son definibles con una fórmula del lenguaje de la lógica de primer orden sobre un universo parcial, así: $$Def(L_\alpha) = L_{\alpha +1}$$
Con todo esto podemos ver que podemos adoptar un axioma extra en la teoría ZF, el cuál es el llamado Axioma de constructabilidad, este nos permite definir de manera rígida el concepto de conjunto. Pero estas no son todas las ventajas que nos brinda adoptar este axioma, pues si lo damos por hecho, tendremos que todo conjunto es bien ordenable, y por lo tanto el axioma de elección es verdadero en este modelo, además, la hipótesis del continuo generalizada también resulta ser cierta.